Conversia PDF in Excel extrage textul din documentul dvs., analizeaza aspectul spatial pentru a detecta randuri si coloane si creeaza o foaie de calcul .xlsx structurata. Instrumentul identifica datele tabulare examinand modul in care elementele de text sunt pozitionate pe fiecare pagina. Elementele pe aceeasi linie orizontala devin un rand, iar spatierea consistenta intre grupuri defineste limitele coloanelor.
Canalul de extractie ruleaza in intregime in browserul dvs. PDF.js citeste documentul si returneaza elementele de text cu coordonate x/y. Codul nostru de analiza a aspectului grupeaza aceste elemente in randuri si coloane pe baza pozitiilor lor. Biblioteca xlsx creeaza apoi o foaie de calcul cu structura detectata. Pentru tabele bine formatate cu spatiere clara a coloanelor, precizia detectiei este de obicei peste 90%. Tabelele complexe cu celule imbinate sau spatiere neregulata pot necesita ajustare manuala.
Date pe care oamenii le extrag regulat din PDF-uri in foi de calcul:
- Situatii financiare si rapoarte trimestriale cu tabele de venituri
- Articole de factura cu nume de produse, cantitati si preturi
- Fise de note academice si evidente ale studentilor de pe portalurile universitare
- Cataloage de produse cu specificatii organizate in coloane
- Rapoarte statistice guvernamentale cu date demografice sau economice
Serviciile de extractie din cloud folosesc algoritmi mai sofisticati (uneori inclusiv AI) si pot gestiona aspecte mai dezordonate ale tabelelor. Costul este incarcarea situatiilor dvs. financiare sau a datelor clientilor pe un server pe care nu il controlati. Pentru tabele simple cu spatiere regulata a coloanelor, extractia noastra bazata pe browser egaleaza calitatea din cloud. Pentru rapoarte complexe cu tabele imbricate, este posibil sa fie nevoie sa ajustati manual rezultatul foii de calcul.
Daca PDF-ul dvs. contine in principal text in loc de tabele, PDF in Word este o alegere mai buna. Dupa extragerea datelor in Excel, ati putea dori sa divizati PDF-ul original pentru a pastra doar paginile relevante, sau sa il comprimati inainte de arhivare.
Incercati si PDF in Word, Comprimare PDF sau Divizare PDF.