Penukaran PDF ke Excel mengekstrak teks daripada dokumen anda, menganalisis tata letak spasial untuk mengesan baris dan lajur, dan membuat hamparan .xlsx yang berstruktur. Alat ini mengenal pasti data tabular dengan memeriksa bagaimana elemen teks diposisikan pada setiap halaman. Elemen pada garis mendatar yang sama menjadi satu baris, dan jarak konsisten di antara kumpulan mendefinisikan sempadan lajur.
Saluran ekstraksi berjalan sepenuhnya dalam pelayar anda. PDF.js membaca dokumen dan mengembalikan item teks dengan koordinat x/y. Kod analisis tata letak kami mengumpulkan item ini menjadi baris dan lajur berdasarkan kedudukannya. Perpustakaan xlsx kemudian membuat hamparan dengan struktur yang dikesan. Untuk jadual yang diformatkan dengan baik dengan jarak lajur yang jelas, ketepatan pengesanan biasanya di atas 90%. Jadual kompleks dengan sel yang digabungkan atau jarak tidak teratur mungkin memerlukan penyesuaian manual.
Data yang orang kerap ekstrak daripada PDF ke hamparan:
- Laporan kewangan dan penyata suku tahunan dengan jadual pendapatan
- Item baris invois dengan nama produk, kuantiti, dan harga
- Helaian nilai akademik dan catatan pelajar daripada portal universiti
- Katalog produk dengan spesifikasi yang disusun dalam lajur
- Laporan statistik kerajaan dengan data demografi atau ekonomi dalam jadual
Perkhidmatan ekstraksi awan menggunakan algoritma yang lebih canggih (kadang-kadang termasuk AI) dan boleh menangani tata letak jadual yang lebih tidak rapi. Kos adalah memuat naik laporan kewangan atau data klien anda ke pelayan yang tidak anda kawal. Untuk jadual langsung dengan jarak lajur teratur, ekstraksi berasaskan pelayar kami menyamai kualiti awan. Untuk laporan kompleks dengan jadual bersarang, anda mungkin perlu menyesuaikan keluaran hamparan secara manual.
Jika PDF anda mengandungi terutamanya teks daripada jadual, PDF ke Word ialah pilihan yang lebih sesuai. Setelah mengekstrak data ke Excel, anda mungkin ingin memisahkan PDF asli untuk menyimpan hanya halaman yang relevan, atau memampatkannya sebelum mengarsipkan.
Cuba juga PDF ke Word, Mampat PDF, atau Pisahkan PDF.