Est. MMXXVI
pdfviz

Konverzia

Prevod PDF do Excelu online zadarmo

Extrahujte textové a tabuľkové údaje zo súborov PDF a konvertujte ich na tabuľky programu Excel (.xlsx). Nástroj analyzuje rozloženie textu na zistenie riadkov a stĺpcov, čo uľahčuje prácu s údajmi PDF v tabuľkovom hárku.

PDF do Excel

Sem presuňte súbory alebo ich prezerajte kliknutím

Až 200 MB na súbor – spracované lokálne

Ako to funguje

  1. I

    Nahrajte svoj súbor PDF

  2. II

    Tabuľky sa zisťujú a extrahujú automaticky

  3. III

    Stiahnite si excelovú tabuľku (.xlsx)

Ako funguje konverzia PDF do Excelu?

Konverzia PDF do Excelu extrahuje text z vášho dokumentu, analyzuje priestorové rozloženie na zistenie riadkov a stĺpcov a vytvorí štruktúrovanú tabuľku .xlsx. Nástroj identifikuje tabuľkové údaje tým, že skúma, ako sú textové prvky umiestnené na každej stránke. Prvky na tej istej vodorovnej čiare sa stanú riadkami a konzistentné rozstupy medzi skupinami vymedzujú hranice stĺpcov.

Extrakčné potrubie vedie úplne vo vašom prehliadač. PDF.js prečíta dokument a vráti textové položky so súradnicami x/y. Náš kód analýzy rozloženia zoskupuje tieto položky do riadkov a stĺpcov na základe ich pozície. Knižnica xlsx potom vytvorí tabuľku so zistenou štruktúrou. Pre dobre naformátované tabuľky s jasným rozostupom medzi stĺpcami je presnosť detekcie zvyčajne vyššia ako 90 %. Zložité tabuľky so zlúčenými bunkami alebo nepravidelnými medzerami môžu vyžadovať manuálne nastavenie.

Údaje, ktoré ľudia pravidelne extrahujú z PDF do tabuliek:

  • Účtovné závierky a štvrťročné správy s tabuľkami výnosov
  • Fakturačné riadkové položky s názvami produktov, množstvami a cenami
  • Akademické známky a záznamy študentov z univerzitných portálov
  • Katalógy produktov so špecifikáciami usporiadanými do stĺpcov
  • Vládne štatistické správy s tabuľkami demografických alebo ekonomických údajov

Služby cloudovej extrakcie používajú sofistikovanejšie algoritmy (niekedy vrátane AI) a dokážu zvládnuť zložitejšie rozloženia tabuliek. Cenou je nahranie vašich účtovných uzávierok alebo klientskych údajov na server, ktorý nemáte pod kontrolou. V prípade jednoduchých tabuliek s pravidelnými medzerami medzi stĺpcami naša extrakcia založená na prehliadači zodpovedá kvalite cloudu. Pre zložité zostavy s vnorenými tabuľkami možno budete musieť upraviť výstup tabuľky manuálne.

Ak váš PDF obsahuje väčšinou text a nie tabuľky, PDF do Wordu je vhodnejšia. Po extrahovaní údajov do Excelu možno budete chcieť rozdeliť pôvodné PDF ponechať len príslušné strany, príp komprimovať to pred archiváciou.

Vyskusajte tiez PDF do Word, Komprimovať PDF alebo Rozdeliť PDF.

Prečo PDFviz?

  • I

    100% Súkromné

    Vaše súbory nikdy neopustia vaše zariadenie. Všetko spracovanie prebieha lokálne vo vašom prehliadači pomocou technológie WebAssembly. Nulové zhromažďovanie údajov, nulové riziko ochrany osobných údajov.

  • II

    Úplne zadarmo

    Nevyžaduje sa žiadna registrácia. Žiadne skryté poplatky. Žiadne obmedzenia súborov. Žiadne vodoznaky. Len nástroje, ktoré potrebujete, kedykoľvek ich potrebujete.

  • III

    Bleskovo rýchle

    Žiadne čakacie doby na nahrávanie/sťahovanie. Súbory sú vo vašom zariadení spracované okamžite. Dokonca aj veľké súbory sú spracované v priebehu niekoľkých sekúnd.

Časté otázky

01Ako funguje detekcia tabuľky?
Nástroj extrahuje text z PDF a analyzuje priestorové umiestnenie každého textového prvku. Prvky na tej istej vodorovnej čiare sa stanú riadkami a medzery medzi prvkami vymedzujú hranice stĺpcov. Toto funguje dobre pre jasne formátované tabuľky.
02Prevedú sa komplexné tabuľky presne?
Nástroj funguje najlepšie s jednoduchými, dobre štruktúrovanými tabuľkami. Komplexné tabuľky so zlúčenými bunkami, vnorenými tabuľkami alebo nepravidelnými rozloženiami sa nemusia konvertovať dokonale. Po konverzii možno budete musieť upraviť tabuľku manuálne.
03Môžem konvertovať súbory PDF s viacerými tabuľkami?
áno. Všetok textový obsah zo všetkých stránok sa extrahuje do jednej tabuľky. Tabuľky z rôznych stránok sa zobrazia ako po sebe idúce riadky. Potom ich môžete oddeliť podľa potreby vo svojej tabuľkovej aplikácii.
04A čo naskenované tabuľky PDF?
Naskenované súbory PDF, ktoré obsahujú obrázky tabuliek nie je možné spracovať týmto nástrojom, pretože neexistuje žiadny extrahovateľný text. Na konverziu naskenovaných obrázkov na text budete potrebovať softvér OCR.
05Aký formát tabuľky sa používa?
Výstupom je an súbor .xlsx (formát tabuľky Office Open XML), kompatibilný s Microsoft Excel, Tabuľky Google, LibreOffice Calc, Apple Numbers a väčšinou ďalších tabuľkových aplikácií.