การแปลง PDF เป็น Excel จะแยกข้อความจากเอกสารของคุณ วิเคราะห์เค้าโครงเชิงพื้นที่เพื่อตรวจจับแถวและคอลัมน์ และสร้างสเปรดชีต .xlsx ที่มีโครงสร้าง เครื่องมือจะระบุข้อมูลแบบตารางโดยตรวจสอบว่าองค์ประกอบข้อความมีการวางตำแหน่งอย่างไรในแต่ละหน้า องค์ประกอบบนเส้นแนวนอนเดียวกันจะกลายเป็นแถว และระยะห่างระหว่างกลุ่มที่สอดคล้องกันจะกำหนดขอบเขตของคอลัมน์
ไปป์ไลน์การแยกจะทำงานทั้งหมดในเบราว์เซอร์ของคุณ PDF.js อ่านเอกสารและส่งกลับรายการข้อความที่มีพิกัด x/y รหัสการวิเคราะห์โครงร่างของเราจะจัดกลุ่มรายการเหล่านี้เป็นแถวและคอลัมน์ตามตำแหน่ง ไลบรารี xlsx จะสร้างสเปรดชีตที่มีโครงสร้างที่ตรวจพบ สำหรับตารางที่มีการจัดรูปแบบอย่างดีและมีระยะห่างคอลัมน์ที่ชัดเจน โดยทั่วไปความแม่นยำในการตรวจจับจะสูงกว่า 90% ตารางที่ซับซ้อนที่มีเซลล์ที่ผสานหรือมีระยะห่างไม่สม่ำเสมออาจต้องปรับเปลี่ยนด้วยตนเอง
ข้อมูลที่ผู้คนดึงมาจาก PDF เป็นประจำเป็นสเปรดชีต:
- งบการเงินและรายงานรายไตรมาสพร้อมตารางรายได้
- บรรทัดรายการใบแจ้งหนี้พร้อมชื่อผลิตภัณฑ์ ปริมาณ และราคา
- ใบแสดงผลการศึกษาและบันทึกของนักศึกษาจากมหาวิทยาลัย พอร์ทัล
- แคตตาล็อกผลิตภัณฑ์ที่มีข้อมูลจำเพาะจัดอยู่ในคอลัมน์
- รายงานทางสถิติของรัฐบาลพร้อมตารางข้อมูลประชากรหรือเศรษฐกิจ
บริการแยกข้อมูลบนคลาวด์ใช้อัลกอริธึมที่ซับซ้อนมากขึ้น (บางครั้งรวมถึง AI) และสามารถรองรับเค้าโครงตารางที่ยุ่งกว่าได้ ต้นทุนคือการอัปโหลดงบการเงินหรือข้อมูลลูกค้าของคุณไปยังเซิร์ฟเวอร์ที่คุณไม่ได้ควบคุม สำหรับตารางที่ไม่ซับซ้อนซึ่งมีระยะห่างคอลัมน์สม่ำเสมอ การแยกตามเบราว์เซอร์ของเราจะตรงกับคุณภาพของระบบคลาวด์ สำหรับรายงานที่ซับซ้อนซึ่งมีตารางซ้อนกัน คุณอาจต้องปรับเอาต์พุตสเปรดชีตด้วยตนเอง
หาก PDF ของคุณมีข้อความเป็นส่วนใหญ่แทนที่จะเป็นตาราง PDF เป็น Word จะเหมาะสมกว่า หลังจากแยกข้อมูลไปยัง Excel แล้ว คุณอาจต้องการ แยก PDF ต้นฉบับ เพื่อเก็บเฉพาะหน้าที่เกี่ยวข้อง หรือ บีบอัดข้อมูล ก่อนที่จะเก็บถาวร
ลองใช้ แปลง PDF เป็น Word, ลดขนาดไฟล์ PDF หรือ แยกไฟล์ PDF ด้วย