PDF سے Excel تبدیلی آپ کی دستاویز سے متن نکالتی ہے، قطاروں اور کالموں کی نشاندہی کے لیے مقامی لے آؤٹ کا تجزیہ کرتی ہے، اور ایک منظم .xlsx اسپریڈشیٹ بناتی ہے۔ ٹول ہر صفحے پر متن عناصر کی پوزیشن جانچ کر جدولی ڈیٹا شناخت کرتی ہے۔ ایک ہی افقی لائن پر موجود عناصر ایک قطار بنتے ہیں، اور گروپوں کے درمیان مسلسل فاصلہ کالم کی حدود متعین کرتا ہے۔
نکالنے کی پائپ لائن مکمل طور پر آپ کے براؤزر میں چلتی ہے۔ PDF.js دستاویز پڑھتی ہے اور x/y کوآرڈینیٹس کے ساتھ متن آئٹمز واپس کرتی ہے۔ ہمارا لے آؤٹ تجزیہ کوڈ ان آئٹمز کو ان کی پوزیشنوں کی بنیاد پر قطاروں اور کالموں میں گروپ کرتا ہے۔ xlsx لائبریری پھر شناخت شدہ ساخت کے ساتھ اسپریڈشیٹ بناتی ہے۔ واضح کالم فاصلے والی اچھی فارمیٹ شدہ ٹیبلز کے لیے شناخت کی درستگی عام طور پر 90% سے زیادہ ہے۔ مرج شدہ سیلز یا بے قاعدہ فاصلے والی پیچیدہ ٹیبلز کو دستی ایڈجسٹمنٹ کی ضرورت ہو سکتی ہے۔
وہ ڈیٹا جو لوگ باقاعدگی سے PDFs سے اسپریڈشیٹس میں نکالتے ہیں:
- آمدنی ٹیبلز والے مالیاتی بیانات اور سہ ماہی رپورٹس
- پروڈکٹ ناموں، مقداروں، اور قیمتوں والی انوائس لائن آئٹمز
- یونیورسٹی پورٹلز سے تعلیمی گریڈ شیٹس اور طلبہ ریکارڈز
- کالموں میں منظم سپیسیفیکیشنز والے پروڈکٹ کیٹلاگ
- آبادیاتی یا اقتصادی ڈیٹا ٹیبلز والی سرکاری شماریاتی رپورٹس
کلاؤڈ نکالنے کی سروسز زیادہ نفیس الگورتھم استعمال کرتی ہیں (بعض اوقات AI شامل) اور بے ترتیب ٹیبل لے آؤٹس سنبھال سکتی ہیں۔ قیمت آپ کے مالیاتی بیانات یا کلائنٹ ڈیٹا ایسے سرور پر اپ لوڈ کرنا ہے جس پر آپ کا کنٹرول نہیں۔ باقاعدہ کالم فاصلے والی سادہ ٹیبلز کے لیے ہماری براؤزر پر مبنی نکالنا کلاؤڈ کوالٹی کے برابر ہے۔ نیسٹڈ ٹیبلز والی پیچیدہ رپورٹس کے لیے آپ کو اسپریڈشیٹ آؤٹ پٹ دستی طور پر ایڈجسٹ کرنا ہوگا۔
اگر آپ کی PDF میں ٹیبلز کی بجائے زیادہ تر متن ہے تو PDF سے Word بہتر ہے۔ Excel میں ڈیٹا نکالنے کے بعد، آپ صرف متعلقہ صفحات رکھنے کے لیے اصل PDF تقسیم کر سکتے ہیں، یا محفوظ کرنے سے پہلے اسے کمپریس کر سکتے ہیں۔
PDF سے Word, PDF کمپریس کریں, یا PDF تقسیم کریں بھی آزمائیں۔