# დასკანირებული PDF ტექსტი ვერ შეირჩევა - როგორ გამოვასწოროთ OCR-ის გამოყენებით

> გახსენით დასკანირებული PDF და ვერ ხაზს უსვამთ ან კოპირებთ ტექსტს? ეს მხოლოდ სურათის PDF-ია ტექსტის ფენის გარეშე. აი, მიზეზი და როგორ ასწორებს OCR ამას მყისიერად.

- Source: https://pdfviz.com/ka/blog/scanned-pdf-text-not-selectable
- Language: ka
- Published: 2026-04-08
- Updated: 2026-04-08
- Reading time: 6 min
- Publisher: PDFviz (https://pdfviz.com)
- License: All rights reserved. Attribution required for excerpts.

---
## რატომ ვერ შეარჩევთ ტექსტს დასკანირებულ PDF-ში?

როცა დოკუმენტი **ფიზიკურად სკანდება** და ინახება PDF-ად, სკანერი გვერდის ბრტყელ სურათს იღებს - ისე, როგორც ფოტოს გადაღება. მიღებული ფაილი შეიცავს არანაირ რეალურ ტექსტის სიმბოლოებს, მხოლოდ პიქსელებს, რომლებიც ასოების მსგავსად არის განლაგებული. ამიტომ, სადმე დოკუმენტში დაჭერა არ ირჩევს არაფერს: კურსორისთვის არ არსებობს ტექსტის ფენა.

ეს PDF-ის ერთ-ერთი ყველაზე გავრცელებული პრობლემაა. დოკუმენტი ეკრანზე სრულყოფილად წასაკითხია, მაგრამ არსებითად ეს ფოტოა, PDF-ის გარსში ჩასმული. არ შეიძლება მოძიება, კოპირება, ან ეკრანის წამკითხველის ანალიზი.

## რა არის OCR და როგორ ასწორებს?

**OCR (Optical Character Recognition)** არის ტექნოლოგია, რომელიც ტექსტის სურათს აანალიზებს და გარდაქმნის მანქანის მიერ წასაკითხ სიმბოლოებად. პროგრამა ასოების ფორმებს იხილავს, ცნობილ შაბლონებთან ადარებს და გამოაქვს ტექსტის ფენა, რომელიც PDF-ში ბრუნდება.

OCR-ის დამუშავების შემდეგ, იღებთ **საძიებელ, შეირჩეულ PDF-ს** - ვიზუალურად იდენტურს ორიგინალთან, მაგრამ ახლა კურსორს შეუძლია სიტყვების მონიშვნა, Ctrl+F-ს შეუძლია ფრაზების ძიება და ასლი-ჩასმა ნორმალურად მუშაობს. ეკრანის წამკითხველებსა და ხელმისაწვდომობის ინსტრუმენტებსაც შეუძლიათ წაკითხვა.

## როგორ გამოვიყენოთ OCR დასკანირებულ PDF-ზე

დასკანირებულ PDF-ზე OCR-ის დასამატებლად არსებობს რამდენიმე გზა, უფასო ბრაუზერის ინსტრუმენტებიდან სამაგიდო პროგრამულ უზრუნველყოფამდე:

- **Word-ად გარდაქმენით, შემდეგ შეინახეთ PDF-ად:** ჩვენი [PDF-ის Word-ად გარდამქმნელი](https://pdfviz.com/pdf-to-word) ვიზუალურ შინაარსს ამოიღებს და გარდაქმნის რედაქტირებად Word დოკუმენტად. Word-ში მოხვედრისთანავე ტექსტი სრულად შეირჩევა. შემდეგ შეიძლება ხელახლა ექსპორტი გაკეთდეს PDF-ად სათანადო ტექსტის ფენით.
- **Adobe Acrobat (ფასიანი):** ინდუსტრიის სტანდარტული ინსტრუმენტი. გახსენით PDF, გადადით Tools → Scan &amp; OCR → Recognize Text, Acrobat პირდაპირ ამატებს ტექსტის ფენას. ძვირია, მაგრამ ძალიან ზუსტი.
- **Google Drive (უფასო):** ატვირთეთ დასკანირებული PDF Google Drive-ზე, დააწკაპეთ მაუსის მარჯვენა ღილაკით და აირჩიეთ &quot;Open with Google Docs.&quot; Google ავტომატურად ახორციელებს OCR-ს და ტექსტს Docs დოკუმენტში ხსნის. სუფთა სკანებისთვის შესანიშნავად მუშაობს.
- **Tesseract OCR (უფასო, ღია კოდი):** ბრძანების ხაზის ძლიერი OCR ძრავი, გამოყენებული მრავალი აპლიკაციის მიერ. საუკეთესოა დეველოპერებისთვის ან ტექნიკური მომხმარებლებისთვის, ვისაც სურს უფასო, თვითმავალი გადაწყვეტა.
- **Adobe Acrobat ონლაინ (შეზღუდული უფასო):** Adobe შეზღუდულ უფასო OCR დამუშავებას სთავაზობს გამოწერის გარეშე მომხმარებლებს მათი ონლაინ ინსტრუმენტების საშუალებით.

## OCR-ის სიზუსტის გასაუმჯობესებლად რჩევები

OCR-ის ხარისხი დიდად არის დამოკიდებული ორიგინალი სკანის ხარისხზე. სიზუსტის გასამდიდრებლად გამოიყენეთ ეს რჩევები:

- **დასკანეთ 300 DPI-ზე ან მეტზე:** დაბალი გარჩევადობის სკანები ბუნდოვან სიმბოლოებს ქმნის, რომლებსაც OCR ძრავები შეცდომით კითხულობენ. 300 DPI მინიმუმია; 600 DPI იდეალურია პატარა ტექსტისთვის ან დეტალიანი დოკუმენტებისთვის.
- **ტექსტური დოკუმენტებისთვის გამოიყენეთ შავ-თეთრი:** ფერადი სკანები ფაილის ზომას ზრდის, OCR-ის სიზუსტე ტექსტისთვის კი არ იმატებს. შავ-თეთრი ან ნაცრისფერი ტონი საკმარისია ბოლ დოკუმენტებისთვის.
- **გვერდები სწორად შეინარჩუნეთ:** დახრილი ან გადახრილი გვერდები OCR პროგრამას დაბნეობს. თანამედროვე ინსტრუმენტების უმეტესობას შეუძლია ავტომატური გასწორება, მაგრამ სწორად დაწყება ეხმარება.
- **ყავის ლაქები და დაბინძურება არ დაუშვათ:** დოკუმენტზე ფიზიკური ნიშნები სიმბოლოებად შეცდომით იკითხება. შესაძლებლობის შემთხვევაში გაწმინდეთ ორიგინალი.
- **გამოსვლა შეამოწმეთ:** OCR 100% ზუსტი არ არის. ყოველთვის გადაამოწმეთ შედეგი, განსაკუთრებით ციფრებისთვის, პუნქტუაციისთვის და ხელნაწერი სექციებისთვის.

## OCR-ის შემდეგ: საჭიროებისამებრ შეამცირეთ ფაილის ზომა

OCR-ის დამუშავება ზოგჯერ PDF-ის ფაილის ზომას ზრდის, რადგან ამატებს დამალულ ტექსტის ფენას არსებული სურათის ფენის თავზე. თუ მიღებული ფაილი ძალიან დიდია, გამოიყენეთ ჩვენი [PDF კომპრესორი](https://pdfviz.com/compress-pdf) ვიზუალური ხარისხის დაკარგვის გარეშე ზომის შესამცირებლად.

## რა გავაკეთოთ, თუ OCR ტექსტს სწორად ვერ ცნობს?

OCR-ის სიზუსტე დამოკიდებულია ორიგინალი სკანის ხარისხზე. **ცუდი შედეგები გავრცელებულია**: ძალიან პატარა შრიფტებით (8pt-ზე ქვემოთ), ხელნაწერი ტექსტით, დეკორატიული ან უჩვეულო შრიფტებით, გამოფერილი მელნით ან 200 DPI-ზე ქვემოთ დაბალი ხარისხის სკანებით. ამ შემთხვევებში, ხელით გადაბეჭდვა შეიძლება საჭირო გახდეს - ან ორიგინალი დოკუმენტის ხელახლა სკანირება მაღალი ხარისხით OCR-ის ხელახლა გაშვებამდე.

## FAQ

### რატომ არ შეირჩევა ჩემი PDF-ის ტექსტი?

**თქვენი PDF დასკანირებული სურათია**, არ არის ჩაშენებული ტექსტის ფენის მქონე დოკუმენტი. როცა ქაღალდის დოკუმენტი სკანდება და PDF-ად ინახება, შედეგი არსებითად გვერდის ფოტოა - ასოების ფორმის პიქსელები, მაგრამ არა რეალური ტექსტი. შეირჩეულის გასაკეთებლად, საჭიროა OCR (Optical Character Recognition) გაშვება ტექსტის ფენის დასამატებლად.

### არსებობს თუ არა დასკანირებული PDF ტექსტის შეირჩევის უფასო გზა?

დიახ - **Google Drive გთავაზობს უფასო OCR-ს**: ატვირთეთ PDF, დააწკაპეთ მარჯვენა ღილაკით, გახსენით Google Docs-ით. Google ავტომატურად ცნობს ტექსტს. ალტერნატიულად, ჩვენი PDF-ის Word-ად გარდამქმნელი შინაარსს ამოიღებს რედაქტირებად დოკუმენტად. სრულად უფასო სამაგიდო გადაწყვეტისთვის, Tesseract OCR ღია კოდი და ძალიან ძლიერია.

### OCR ცვლის PDF-ის გარეგნობას?

**არა - OCR უხილავ ტექსტის ფენას ამატებს** არსებული სურათის მიღმა. PDF-ის ვიზუალური გარეგნობა ზუსტად ასეთივე რჩება. მხოლოდ ტექსტის შეირჩევის, კოპირების და ძიების შესაძლებლობას იძენთ. გამონაკლისია Word-ზე გარდაქმნა და ხელახლა ექსპორტი, სადაც მცირე ფორმატირების ცვლილებები შეიძლება მოხდეს.

### რამდენად ზუსტია OCR დასკანირებულ დოკუმენტებზე?

თანამედროვე OCR **300 DPI-ზე ან მეტზე სუფთად, კარგად დასკანირებულ დოკუმენტებზე 95-99% ზუსტია**. სიზუსტე მნიშვნელოვნად მცირდება დაბალი გარჩევადობის სკანებისთვის, ხელნაწერისთვის, უჩვეულო შრიფტებისთვის ან ფიზიკურად დაზიანებული გვერდებისთვის. მნიშვნელოვანი დოკუმენტებისთვის გამოყენებამდე ყოველთვის გადაამოწმეთ შედეგი.

### შეიძლება ხელნაწერი PDF ტექსტი OCR-ით შეირჩეულად გავხადო?

**სტანდარტული OCR ცუდად მუშაობს ხელნაწერ ტექსტზე** - ის შექმნილია ნაბეჭდი, ტექნიკური ტექსტისთვის. სპეციალიზებული ხელნაწერის ამომცნობი ინსტრუმენტები არსებობს, მაგრამ ბეჭდური ტექსტის OCR-ზე გაცილებით ნაკლებ ზუსტია. თუ დოკუმენტი შეიცავს ბეჭდური და ხელნაწერის ნაზავს, OCR სწორად ამოიცნობს ბეჭდურ ნაწილებს, მაგრამ სავარაუდოდ ხელნაწერ სექციებს შეცდომით წაიკითხავს.
