A PDF-ből Excel-be konvertálás kinyeri a szöveget a dokumentumból, elemzi a térbeli elrendezést a sorok és oszlopok felismeréséhez, és strukturált .xlsx táblázatot hoz létre. Az eszköz úgy azonosítja a táblázatos adatokat, hogy megvizsgálja, hogyan helyezkednek el a szöveges elemek az egyes oldalakon. Az azonos vízszintes vonalon lévő elemek egy sort alkotnak, és a csoportok közötti konzisztens térköz határozza meg az oszlophatárokat.
A kinyerési folyamat teljes egészében a böngészőjében fut. A PDF.js beolvassa a dokumentumot, és x/y koordinátákkal rendelkező szöveges elemeket ad vissza. Elrendezéselemző kódunk ezek pozíciói alapján sorokba és oszlopokba csoportosítja az elemeket. Az xlsx könyvtár ezután a felismert struktúrával létrehozza a táblázatot. Jól formázott, világos oszloptávolságú táblázatoknál a felismerés pontossága jellemzően 90% felett van. Az egyesített cellákkal vagy szabálytalan távolságokkal rendelkező összetett táblázatok manuális módosítást igényelhetnek.
Adatok, amelyeket rendszeresen nyernek ki PDF-ekből táblázatokba:
- Pénzügyi kimutatások és negyedéves jelentések bevételi táblázatokkal
- Számla tételsorok terméknevekkel, mennyiségekkel és árakkal
- Akadémiai osztályzati lapok és hallgatói nyilvántartások egyetemi portálokról
- Termékkatalógusok oszlopokba rendezett specifikációkkal
- Kormányzati statisztikai jelentések demográfiai vagy gazdasági adattáblázatokkal
A felhőalapú kinyerő szolgáltatások kifinomultabb algoritmusokat használnak (néha MI-t is), és rendezetlenebb táblázatelrendezéseket is kezelnek. Az ára az, hogy pénzügyi kimutatásait vagy ügyféladatait egy Ön által nem felügyelt szerverre tölti fel. Egyszerű, szabályos oszloptávolságú táblázatok esetén böngészőalapú kinyerésünk megfelel a felhőalapú minőségnek. Összetett, beágyazott táblázatokkal rendelkező jelentésekhez szükség lehet a táblázat kimenet manuális módosítására.
Ha a PDF-je főleg szöveget tartalmaz táblázatok helyett, a PDF konvertálása Word-be jobb megoldás. Az adatok Excel-be történő kinyerése után érdemes felosztani az eredeti PDF-et, hogy csak a releváns oldalakat tartsa meg, vagy tömöríteni az archiválás előtt.
Probald ki a PDF konvertálása Word-be, PDF tömörítése vagy PDF felosztása eszkozt is.