Est. MMXXVI
pdfviz

Конвертация

Конвертировать PDF в Excel онлайн бесплатно

Извлеките текст и табличные данные из PDF-файлов и конвертируйте их в электронные таблицы Excel (.xlsx). Инструмент анализирует расположение текста для обнаружения строк и столбцов, упрощая работу с данными PDF в табличном формате.

PDF в Excel

Перетащите файлы сюда или нажмите для выбора

До 200 МБ на файл - обработка происходит локально

Как это работает

  1. I

    Загрузите ваш PDF-файл

  2. II

    Таблицы обнаруживаются и извлекаются автоматически

  3. III

    Скачайте вашу электронную таблицу Excel (.xlsx)

Как работает конвертация PDF в Excel?

Конвертация PDF в Excel извлекает текст из вашего документа, анализирует пространственное расположение для обнаружения строк и столбцов и создаёт структурированную электронную таблицу .xlsx. Инструмент определяет табличные данные, исследуя расположение текстовых элементов на каждой странице. Элементы на одной горизонтальной линии становятся строкой, а постоянное расстояние между группами определяет границы столбцов.

Конвейер извлечения работает целиком в вашем браузере. PDF.js считывает документ и возвращает текстовые элементы с координатами x/y. Наш код анализа макета группирует эти элементы в строки и столбцы на основе их позиций. Библиотека xlsx затем создаёт электронную таблицу с обнаруженной структурой. Для хорошо отформатированных таблиц с чётким межстолбцовым расстоянием точность определения обычно превышает 90%. Сложные таблицы с объединёнными ячейками или нерегулярным расстоянием могут потребовать ручной корректировки.

Данные, которые люди регулярно извлекают из PDF в электронные таблицы:

  • Финансовые отчёты и квартальные сводки с таблицами доходов
  • Позиции счетов с наименованиями товаров, количеством и ценами
  • Академические ведомости и студенческие записи с университетских порталов
  • Каталоги продукции со спецификациями, организованными в столбцы
  • Государственные статистические отчёты с демографическими или экономическими таблицами данных

Облачные сервисы извлечения используют более сложные алгоритмы (иногда включающие ИИ) и могут обрабатывать менее структурированные таблицы. Цена этого - загрузка ваших финансовых отчётов или клиентских данных на сервер, который вы не контролируете. Для простых таблиц с регулярным расстоянием между столбцами наше браузерное извлечение соответствует облачному качеству. Для сложных отчётов с вложенными таблицами может потребоваться ручная корректировка результата.

Если ваш PDF содержит в основном текст, а не таблицы, PDF в Word подойдёт лучше. После извлечения данных в Excel вы можете разделить исходный PDF для сохранения только релевантных страниц или сжать его перед архивированием.

Takze poprobujte PDF в Word, Сжать PDF ili Разделить PDF.

Почему PDFviz?

  • I

    100% конфиденциальность

    Ваши файлы никогда не покидают ваше устройство. Вся обработка происходит локально в вашем браузере с использованием технологии WebAssembly. Никакого сбора данных, никакого риска для конфиденциальности.

  • II

    Полностью бесплатно

    Регистрация не требуется. Никаких скрытых платежей. Никаких ограничений на файлы. Никаких водяных знаков. Только инструменты, которые вам нужны, когда они вам нужны.

  • III

    Молниеносная скорость

    Никакого ожидания загрузки или скачивания. Файлы обрабатываются мгновенно на вашем устройстве. Даже большие файлы обрабатываются за считанные секунды.

Часто задаваемые вопросы

01Как работает определение таблиц?
Инструмент извлекает текст из PDF и анализирует пространственное расположение каждого текстового элемента. Элементы на одной горизонтальной линии становятся строкой, а расстояние между элементами определяет границы столбцов. Лучше всего работает с чётко отформатированными таблицами.
02Будут ли сложные таблицы конвертированы точно?
Инструмент лучше всего работает с простыми, хорошо структурированными таблицами. Сложные таблицы с объединёнными ячейками, вложенными таблицами или нерегулярной разметкой могут конвертироваться не идеально. Может потребоваться ручная корректировка таблицы после конвертации.
03Можно ли конвертировать PDF с несколькими таблицами?
Да. Всё текстовое содержимое со всех страниц извлекается в одну электронную таблицу. Таблицы с разных страниц будут отображаться как последовательные строки. Затем вы можете разделить их по необходимости в вашем табличном редакторе.
04Что насчёт отсканированных PDF-таблиц?
Отсканированные PDF, содержащие изображения таблиц, не могут быть обработаны этим инструментом, так как в них нет извлекаемого текста. Сначала потребуется программное обеспечение OCR для конвертации отсканированных изображений в текст.
05Какой формат электронной таблицы используется?
Результат - файл .xlsx (формат Office Open XML Spreadsheet), совместимый с Microsoft Excel, Google Sheets, LibreOffice Calc, Apple Numbers и большинством других табличных приложений.