PDF файлын Excel форматына түрлендіру құжатыңыздан мәтінді шығарады, жолдар мен бағандарды анықтау үшін кеңістік орналасуын талдайды және құрылымдық .xlsx электрондық кестесін жасайды. Құрал мәтін элементтерінің әрбір бетте орналасуын тексеру арқылы кестелік деректерді анықтайды. Бір көлденең сызықтағы элементтер жолға айналады және топтар арасындағы дәйекті аралық баған шекараларын анықтайды.
Шығару құбыры толығымен сізде өтеді браузер. PDF.js құжатты оқиды және x/y координаттары бар мәтін элементтерін қайтарады. Біздің орналасуды талдау кодымыз бұл элементтерді орындарына негізделген жолдар мен бағандарға топтайды. Содан кейін xlsx кітапханасы анықталған құрылымы бар электрондық кестені жасайды. Баған аралығы анық, жақсы пішімделген кестелер үшін анықтау дәлдігі әдетте 90% жоғары болады. Біріктірілген ұяшықтары немесе тұрақты емес аралығы бар күрделі кестелер қолмен реттеуді қажет етуі мүмкін.
Адамдар PDF файлдарынан электрондық кестелерге үнемі шығарып алатын деректер:
- Кіріс кестелері бар қаржылық есеп және тоқсандық есептер
- Өнім атаулары, саны және бағасы бар шот-фактура желісі элементтері
- Университет порталындағы академиялық баға парақтары мен студенттердің жазбалары
- Бағандарда ұйымдастырылған техникалық сипаттамалары бар өнім каталогтары
- Демографиялық немесе экономикалық деректер кестелері бар мемлекеттік статистикалық есептер
Бұлтты экстракция қызметтері күрделірек алгоритмдерді (кейде AI қоса) пайдаланады және кестелердің күрделі орналасуларын өңдей алады. Құны қаржылық есептерді немесе клиент деректерін сіз басқармайтын серверге жүктеп салу болып табылады. Тұрақты баған аралығы бар қарапайым кестелер үшін біздің браузерге негізделген экстракция бұлт сапасына сәйкес келеді. Кірістірілген кестелері бар күрделі есептер үшін электрондық кестенің шығысын қолмен реттеу қажет болуы мүмкін.
Егер сіздің PDF файлыңыз кестеден гөрі мәтінді қамтыса, PDF-тен Word жақсырақ сәйкес келеді. Деректерді Excel бағдарламасына шығарып алғыңыз келуі мүмкін түпнұсқа PDF файлын бөліңіз тек сәйкес беттерді сақтау үшін немесе оны қысыңыз мұрағаттау алдында.
PDF-ті Word-ке (PDF to Word), PDF сығу (Compress PDF) немесе PDF бөлу (Split PDF) құралын да қолданып көріңіз.