Est. MMXXVI
pdfviz

I-convert

I-convert ang PDF sa Excel Online nang Libre

I-extract ang text at tabular na data mula sa mga PDF file at i-convert ang mga ito sa Excel spreadsheet (.xlsx). Sinusuri ng tool ang layout ng teksto upang matukoy ang mga hilera at column, na ginagawang madali upang gumana sa PDF data sa isang spreadsheet.

PDF tungo sa Excel

I-drag ang mga file dito o i-click para pumili

Hanggang 200 MB bawat file - naproseso nang lokal

Paano ito gumagana

  1. I

    I-upload ang iyong PDF file

  2. II

    Ang mga talahanayan ay nakita at awtomatikong na-extract

  3. III

    I-download ang iyong Excel spreadsheet (.xlsx)

Paano Gumagana ang PDF to Excel Conversion?

Kinukuha ng conversion ng PDF sa Excel ang text mula sa iyong dokumento, sinusuri ang spatial na layout para makita ang mga row at column, at gumagawa ng structured na .xlsx spreadsheet. Tinutukoy ng tool ang tabular na data sa pamamagitan ng pagsusuri kung paano nakaposisyon ang mga elemento ng teksto sa bawat pahina. Ang mga elemento sa parehong pahalang na linya ay nagiging isang row, at ang pare-parehong espasyo sa pagitan ng mga pangkat ay tumutukoy sa mga hangganan ng column.

Ang pipeline ng pagkuha ay ganap na tumatakbo sa iyong browser. Binabasa ng PDF.js ang dokumento at ibinabalik ang mga text item na may mga x/y na coordinate. Pinapangkat ng aming code sa pagsusuri ng layout ang mga item na ito sa mga row at column batay sa kanilang mga posisyon. Ang xlsx library pagkatapos ay gagawa ng spreadsheet na may nakitang istraktura. Para sa mga talahanayang mahusay na na-format na may malinaw na espasyo ng column, ang katumpakan ng pagtuklas ay karaniwang nasa itaas ng 90%. Ang mga kumplikadong talahanayan na may pinagsamang mga cell o hindi regular na espasyo ay maaaring mangailangan ng manu-manong pagsasaayos.

Data na regular na kinukuha ng mga tao mula sa mga PDF patungo sa mga spreadsheet:

  • Mga financial statement at quarterly na ulat na may mga talahanayan ng kita
  • Invoice line item na may mga pangalan ng produkto, dami, at presyo
  • Mga sheet ng akademikong grado at mga tala ng mag-aaral mula sa mga portal ng unibersidad
  • Mga katalogo ng produkto na may mga pagtutukoy na nakaayos sa mga column
  • Mga istatistikal na ulat ng pamahalaan na may mga talahanayan ng demograpiko o pang-ekonomiyang data

Gumagamit ang mga serbisyo ng cloud extraction ng mas sopistikadong mga algorithm (minsan kasama ang AI) at kayang pangasiwaan ang mas magulo na mga layout ng talahanayan. Ang gastos ay ang pag-upload ng iyong mga financial statement o data ng kliyente sa isang server na hindi mo kontrolado. Para sa mga diretsong talahanayan na may regular na espasyo ng column, tumutugma ang aming pag-extract na nakabatay sa browser sa kalidad ng ulap. Para sa mga kumplikadong ulat na may mga nested na talahanayan, maaaring kailanganin mong ayusin nang manu-mano ang output ng spreadsheet.

Kung ang iyong PDF ay naglalaman ng halos lahat ng teksto sa halip na mga talahanayan, PDF sa Word ay mas angkop. Pagkatapos mag-extract ng data sa Excel, maaaring gusto mo hatiin ang orihinal na PDF upang panatilihin lamang ang mga nauugnay na pahina, o i-compress ito bago i-archive.

Subukan din ang PDF tungo sa Word, I-compress ang PDF, o Ibahagi ang PDF.

Bakit pipiliin ang PDFviz?

  • I

    100% Pribado

    Ang iyong mga file ay hindi kailanman umaalis sa iyong device. Ang lahat ay pinoproseso nang lokal. Walang panganib sa iyong privacy.

  • II

    Ganap na Libre

    Walang registration. Walang hidden fees. Walang limitasyon. Ang mga tool lang na kailangan mo.

  • III

    Napakabilis

    Walang paghihintay sa upload. Ang mga file ay agad na pinoproseso sa iyong computer.

Mga Madalas Itanong

01Paano gumagana ang pagtukoy ng talahanayan?
Kinukuha ng tool ang teksto mula sa PDF at sinusuri ang spatial na pagpoposisyon ng bawat elemento ng teksto. Ang mga elemento sa parehong pahalang na linya ay nagiging isang row, at ang espasyo sa pagitan ng mga elemento ay tumutukoy sa mga hangganan ng column. Ito ay mahusay na gumagana para sa malinaw na na-format na mga talahanayan.
02Ang mga kumplikadong talahanayan ba ay tumpak na magko-convert?
Ang kasangkapan pinakamahusay na gumagana sa simple at maayos na mga talahanayan. Ang mga kumplikadong talahanayan na may pinagsamang mga cell, nested na talahanayan, o hindi regular na mga layout ay maaaring hindi ganap na ma-convert. Maaaring kailanganin mong ayusin nang manu-mano ang spreadsheet pagkatapos ng conversion.
03Maaari ba akong mag-convert ng mga PDF na may maraming mga talahanayan?
Oo. Ang lahat ng nilalaman ng teksto mula sa lahat ng mga pahina ay kinukuha sa isang spreadsheet. Ang mga talahanayan mula sa iba’t ibang mga pahina ay lilitaw bilang magkakasunod na mga hilera. Pagkatapos ay maaari mong paghiwalayin ang mga ito kung kinakailangan sa iyong spreadsheet application.
04Paano naman ang mga na-scan na PDF table?
Mga na-scan na PDF na naglalaman ng mga larawan ng mga talahanayan hindi maproseso ng tool na ito, dahil walang na-extract na text. Kakailanganin mo ang OCR software upang i-convert muna ang mga na-scan na larawan sa teksto.
05Anong format ng spreadsheet ang ginagamit?
Ang output ay isang .xlsx file (Office Open XML Spreadsheet format), tugma sa Microsoft Excel, Google Sheets, LibreOffice Calc, Apple Numbers, at karamihan sa iba pang mga application ng spreadsheet.