La conversione da PDF a Excel estrae il testo dal vostro documento, analizza il layout spaziale per rilevare righe e colonne e crea un foglio di calcolo .xlsx strutturato. Lo strumento identifica i dati tabulari esaminando come gli elementi di testo sono posizionati su ogni pagina. Gli elementi sulla stessa linea orizzontale diventano una riga e la spaziatura costante tra i gruppi definisce i confini delle colonne.
La pipeline di estrazione viene eseguita interamente nel vostro browser. PDF.js legge il documento e restituisce elementi di testo con coordinate x/y. Il nostro codice di analisi del layout raggruppa questi elementi in righe e colonne in base alle loro posizioni. La libreria xlsx crea poi un foglio di calcolo con la struttura rilevata. Per tabelle ben formattate con spaziatura chiara delle colonne, la precisione del rilevamento supera tipicamente il 90%. Tabelle complesse con celle unite o spaziatura irregolare potrebbero richiedere aggiustamenti manuali.
Dati che le persone estraggono regolarmente dai PDF ai fogli di calcolo:
- Bilanci e report trimestrali con tabelle di fatturato
- Voci di fattura con nomi di prodotti, quantità e prezzi
- Schede di valutazione accademica e registri degli studenti da portali universitari
- Cataloghi di prodotti con specifiche organizzate in colonne
- Report statistici governativi con dati demografici o economici tabulari
I servizi di estrazione cloud utilizzano algoritmi più sofisticati (a volte inclusa l’IA) e possono gestire layout tabulari più disordinati. Il costo è il caricamento dei vostri bilanci o dati dei clienti su un server che non controllate. Per tabelle semplici con spaziatura regolare delle colonne, la nostra estrazione basata sul browser eguaglia la qualità dei servizi cloud. Per report complessi con tabelle nidificate, potrebbe essere necessario aggiustare l’output manualmente.
Se il vostro PDF contiene soprattutto testo anziché tabelle, PDF in Word è più adatto. Dopo aver estratto i dati in Excel, potreste voler dividere il PDF originale per tenere solo le pagine pertinenti, oppure comprimerlo prima dell’archiviazione.
Prova anche PDF in Word, Comprimi PDF o Dividi PDF.