Est. MMXXVI
pdfviz

Преобразуване

Конвертирайте PDF в Excel онлайн безплатно

Извличайте текстови и таблични данни от PDF файлове и ги конвертирайте в електронни таблици на Excel (.xlsx). Инструментът анализира оформлението на текста, за да открие редове и колони, което улеснява работата с PDF данни в табличен формат.

PDF към Excel

Плъзнете файлове тук или щракнете, за да изберете

До 200 MB на файл - обработката се извършва локално

Как става това

  1. I

    Качете вашия PDF файл

  2. II

    Таблиците се откриват и извличат автоматично

  3. III

    Изтеглете вашата електронна таблица в Excel (.xlsx)

Как работи конвертирането на PDF към Excel?

Конверторът на PDF към Excel извлича текст от вашия документ, анализира пространственото оформление, за да открие редове и колони, и създава структурирана .xlsx електронна таблица. Инструментът идентифицира таблични данни, като изследва подредбата на текстовите елементи на всяка страница. Елементите на една и съща хоризонтална линия стават ред ипостоянното разстояние между групите определя границите на колоните.

Тръбопроводът за извличане работи изцяло във вашия браузър. PDF.js чете документа и връща текстови елементи с координати x/y. Нашият код за анализ на оформлението групира тези елементи в редове и колони въз основа на техните позиции. След това библиотеката xlsx създава електронна таблица с откритата структура. За добре форматирани таблици с ясно разстояние между колонитеточността обикновено надвишава 90%. Сложните таблици с обединени клетки или неправилно разстояние може да изискват ръчни корекции.

Данни, които хората редовно извличат от PDF файлове в електронни таблици:

  • Финансови отчети и тримесечни обобщения с таблици на приходите
  • Фактурни елементи с имена на артикули, количества и цени
  • Академични справки и студентски досиета от университетски портали
  • Продукт каталози със спецификации, организирани в колони
  • Правителствени статистически отчети с таблици с демографски или икономически данни

Услугите за извличане в облак използват по-сложни алгоритми (понякога включващи AI) и могат да обработват по-малко структурирани таблици. Цената на това е качването на вашите финансови отчети или клиентски данни на сървър, който не контролирате. За прости таблици с редовно разстояние между колоните, нашето извличане, базирано на браузър, е с качество в облак. За сложни отчети с вложени таблици може да се наложи ръчно да коригирате резултата.

Ако вашият PDF съдържа предимно текст, а не таблици, PDF към Word ще работи по-добре. След като извлечете данните в Excel, можете да разделите оригиналния PDF, за да запазите само съответните страници, или да го компресирате преди архивиране.

Opitajte sashto PDF към Word, Компресирайте PDF ili Разделяне на PDF.

Защо PDFviz?

  • I

    100% конфиденциалност

    Вашите файлове никога не напускат вашето устройство. Цялата обработка се извършва локално във вашия браузър с помощта на технологията WebAssembly. Без събиране на данни, без риск за поверителността.

  • II

    Напълно безплатно

    Не се изисква регистрация. Без скрити такси. Няма ограничения за файловете. Без водни знаци. Само инструментите, от които се нуждаете, когато имате нужда от тях.

  • III

    Светкавична скорост

    Без чакане за зареждане или изтегляне. Файловете се обработват незабавно на вашето устройство. Дори големи файлове се обработват за секунди.

Често задавани въпроси

01Как работи дефиницията на таблицата?
Инструментът извлича текст от PDF ианализира пространственото разположение на всеки текстов елемент. Елементите на една и съща хоризонтална линия стават ред, а разстоянието между елементите определя границите на колоните. Работи най-добре с ясно форматирани таблици.
02Сложните таблици ще бъдат ли преобразувани точно?
Инструментът работи най-добре с прости, добре структурирани таблици. Сложните таблици с обединени клетки, вложени таблици или неправилно оформление може да не се конвертират перфектно. Може да се наложи ръчно да коригирате таблицата след преобразуването.
03Възможно ли е да конвертирате PDF с множество таблици?
да Цялото текстово съдържание от всички страници се извлича в една електронна таблица. Таблици от различни страници ще се показват като последователни редове. След това можете да ги разделите според нуждите във вашия редактор на електронни таблици.
04Какво ще кажете за сканирани PDF таблици?
Сканираните PDF файлове, съдържащи изображения на таблици, не могат да бъдат обработени от този инструмент, защото не съдържат извличащ се текст. Първо, ще ви е необходим OCR софтуер, за да конвертирате вашите сканирани изображения в текст.
05Какъв формат на електронната таблица се използва?
Резултатът е .xlsx файл (формат на Office Open XML Spreadsheet)съвместим с Microsoft Excel, Google Sheets, LibreOffice Calc, Apple Numbers и повечето други приложения за електронни таблици.