PDF-Excel-muunnos poimii tekstin asiakirjastasi, analysoi paikkatietojen perusteella asettelun tunnistaakseen rivit ja sarakkeet ja luo rakenteisen .xlsx-laskentataulukon. Työkalu tunnistaa taulukkomuotoisen datan tutkimalla, miten tekstielementit on sijoitettu kullekin sivulle. Samalla vaakalinjalla olevista elementeistä tulee rivi, ja johdonmukainen välistys ryhmien välillä määrittelee sarakerajat.
Poimintaputki ajetaan kokonaan selaimessasi. PDF.js lukee asiakirjan ja palauttaa tekstielementit x/y-koordinaatein. Asetteluanalyysikoodimme ryhmittelee nämä elementit riveiksi ja sarakkeiksi niiden sijaintien perusteella. Xlsx-kirjasto luo sitten laskentataulukon tunnistetulla rakenteella. Hyvin muotoilluille taulukoille, joissa on selkeä sarakevälistys, tunnistustarkkuus on tyypillisesti yli 90 %. Monimutkaiset taulukot, joissa on yhdistettyjä soluja tai epäsäännöllistä välistystä, saattavat vaatia manuaalista säätöä.
Dataa, jota ihmiset säännöllisesti poimivat PDF-tiedostoista laskentataulukoihin:
- Tilinpäätökset ja vuosineljännesraportit tuottotaulukoineen
- Laskujen rivitiedot tuotenimikkein, määrin ja hintoin
- Arvosanaluettelot ja opiskelijatiedot yliopistojen portaaleista
- Tuoteluettelot teknisine tietoineen sarakkeissa
- Viranomaisten tilastoraportit väestö- tai talouskäyristä
Pilvipohjaiset poimintapalvelut käyttävät kehittyneempiä algoritmeja (joskus tekoälyä) ja pystyvät käsittelemään sotkuisempia taulukkoasetteluja. Hintana on tilinpäätöstesi tai asiakasdatasi lataaminen palvelimelle, jota et hallitse. Suoraviivaisille taulukoille, joissa on säännöllinen sarakevälistys, selainpohjainen poimintamme vastaa pilvipalveluiden laatua. Monimutkaisille raporteille, joissa on sisäkkäisiä taulukoita, saatat joutua säätämään laskentataulukon tulostetta manuaalisesti.
Jos PDF sisältää pääasiassa tekstiä taulukoiden sijaan, PDF Wordiksi -muunnos sopii paremmin. Datan poimimisen jälkeen Exceliin saatat haluta jakaa alkuperäisen PDF:n säilyttääksesi vain oleelliset sivut tai pakata sen ennen arkistointia.
Kokeile myos PDF Wordiksi, Pakkaa PDF tai Jaa PDF.