ការបំលែង PDF ទៅ Excel (PDF to Excel conversion) ស្រង់ចេញអត្ថបទពីឯកសារ វិភាគប្លង់ (spatial layout) ដើម្បីរកឃើញជួរដេក និងជួរឈរ (rows and columns) ហើយបង្កើត spreadsheet .xlsx ដែលមានរចនាសម្ព័ន្ធ។ ឧបករណ៍រកឃើញទិន្នន័យតារាង (tabular data) ដោយពិនិត្យមើលថាធាតុអត្ថបទ (text elements) ត្រូវបានដាក់ទីតាំងយ៉ាងណានៅលើគ្រប់ទំព័រ។ ធាតុដែលស្ថិតនៅលើបន្ទាត់ (horizontal line) ដូចគ្នា ក្លាយជាជួរដេក (row) ហើយចន្លោះ (spacing) ស្ថិរភាពរវាងក្រុម កំណត់ព្រំដែនជួរឈរ (column boundaries)។
ម៉ាស៊ីននៃការស្រង់ចេញ (extraction pipeline) ដំណើរការទាំងស្រុងក្នុង browser (កម្មវិធីរុករក) របស់អ្នក។ PDF.js អានឯកសារ ហើយប្រគល់ធាតុអត្ថបទជាមួយកូអរដោណេ (coordinates) x/y។ កូដ (code) វិភាគប្លង់ (layout analysis) របស់យើងដាក់ជាក្រុមធាតុទាំងនេះទៅជាជួរដេក និងជួរឈរ (rows and columns) ដោយផ្អែកលើទីតាំងរបស់ពួកវា។ បណ្ណាល័យ xlsx បន្ទាប់មកបង្កើត spreadsheet ជាមួយរចនាសម្ព័ន្ធដែលបានរកឃើញ។ សម្រាប់តារាងដែលមានទ្រង់ទ្រាយ (formatted) ល្អ ជាមួយចន្លោះ (spacing) ជួរឈរច្បាស់លាស់ ភាពត្រឹមត្រូវ (accuracy) នៃការរកឃើញជាធម្មតានៅលើ 90%។ តារាងស្មុគស្មាញ ជាមួយក្រឡារួម (merged cells) ឬចន្លោះ (spacing) មិនទៀងទាត់ ប្រហែលត្រូវការការកែប្រែដោយដៃ (manual adjustment)។
ទិន្នន័យដែលមនុស្សជាទៀងទាត់ស្រង់ចេញពី PDF ទៅ spreadsheets:
- របាយការណ៍ហិរញ្ញវត្ថុ (financial statements) និងរបាយការណ៍ត្រីមាស (quarterly reports) ជាមួយតារាងប្រាក់ចំណូល
- ធាតុបន្ទាត់វិក្កយបត្រ (invoice line items) ជាមួយឈ្មោះផលិតផល ចំនួន និងតម្លៃ
- ផ្ទាំងចំណាត់ (grade sheets) និងកំណត់ត្រាសិស្ស (student records) ពីវិបផតថល (portals) សកលវិទ្យាល័យ
- កាតាឡុក (catalogs) ផលិតផល ជាមួយលក្ខណៈបច្ចេកទេស (specifications) ដែលរៀបចំជាជួរឈរ
- របាយការណ៍ស្ថិតិ (statistical reports) រដ្ឋាភិបាល ជាមួយតារាងទិន្នន័យប្រជាសាស្ត្រ (demographic) ឬសេដ្ឋកិច្ច (economic)
សេវាស្រង់ចេញពពក (cloud extraction services) ប្រើក្បួនដោះស្រាយ (algorithms) ដែលប្រសើរជាង - ពេលខ្លះរួមមាន AI - ហើយអាចដោះស្រាយប្លង់ (layouts) តារាងច្របូកច្របល់ (messier table layouts)។ ថ្លៃដើមគឺការបញ្ចូលរបាយការណ៍ហិរញ្ញវត្ថុ ឬទិន្នន័យអតិថិជនរបស់អ្នក ទៅម៉ាស៊ីនបម្រើ (server) ដែលអ្នកមិនត្រួតពិនិត្យ។ សម្រាប់តារាងដែលងាយស្រួល ជាមួយចន្លោះ (spacing) ជួរឈរទៀងទាត់ ការស្រង់ចេញ browser-based របស់យើងប្រៀបធៀបបានជាមួយ cloud។ សម្រាប់របាយការណ៍ស្មុគស្មាញ ជាមួយតារាងដែលដាក់ជួរ (nested tables) អ្នកប្រហែលត្រូវការកែប្រែ (adjust) លទ្ធផល spreadsheet ដោយដៃ (manually)។
ប្រសិនបើ PDF របស់អ្នកមានអត្ថបទជាចម្បង ជាជាងតារាង PDF ទៅ Word (PDF to Word) ជាការជ្រើសរើសសមស្រប (better fit)។ បន្ទាប់ពីស្រង់ចេញទិន្នន័យទៅ Excel អ្នកប្រហែលចង់ ចែក (split) PDF ដើម ដើម្បីរក្សាតែទំព័រពាក់ព័ន្ធ ឬ បង្ហាប់ (compress) វា មុននឹងរក្សាទុក។
សាកល្បងផងដែរ PDF ទៅ Word, បង្ហាប់ PDF, ឬ បំបែក PDF។