La conversió de PDF a Excel extreu text del vostre document, analitza la disposició espacial per detectar files i columnes, i crea un full de càlcul .xlsx estructurat. L’eina identifica dades tabulars examinant com es posicionen els elements de text a cada pàgina. Els elements a la mateixa línia horitzontal es converteixen en una fila, i l’espaiat consistent entre grups defineix els límits de les columnes.
El procés d’extracció s’executa completament al vostre navegador. PDF.js llegeix el document i retorna elements de text amb coordenades x/y. El nostre codi d’anàlisi de disposició agrupa aquests elements en files i columnes segons les seves posicions. La biblioteca xlsx crea un full de càlcul amb l’estructura detectada. Per a taules ben formatades amb espaiat de columnes clar, la precisió de detecció és típicament superior al 90%. Les taules complexes amb cel·les combinades o espaiat irregular poden necessitar ajust manual.
Dades que habitualment s’extreuen de PDFs a fulls de càlcul:
- Estats financers i informes trimestrals amb taules d’ingressos
- Línies de detall de factures amb noms de productes, quantitats i preus
- Butlletins de qualificacions acadèmiques i expedients estudiantils de portals universitaris
- Catàlegs de productes amb especificacions organitzades en columnes
- Informes estadístics governamentals amb taules de dades demogràfiques o econòmiques
Els serveis d’extracció al núvol utilitzen algorismes més sofisticats (de vegades incloent-hi IA) i poden gestionar dissenys de taules més desordenats. El cost és pujar els vostres estats financers o dades de clients a un servidor que no controleu. Per a taules senzilles amb espaiat de columnes regular, la nostra extracció basada en navegador iguala la qualitat del núvol. Per a informes complexos amb taules imbricades, pot ser necessari ajustar la sortida del full de càlcul manualment.
Si el vostre PDF conté principalment text en lloc de taules, PDF a Word és una millor opció. Després d’extreure dades a Excel, podeu voler dividir el PDF original per conservar només les pàgines rellevants, o comprimir-lo abans d’arxivar-lo.
Proveu tambe PDF a Word, Comprimir PDF o Dividir PDF.