# អត្ថបទ PDF ដែលស្កែនមិនអាចជ្រើសរើសបាន - របៀបជួសជុលដោយ OCR

> បើក PDF ដែលស្កែនហើយមិនអាចបន្លិច ឬចម្លងអត្ថបទបានទេ? នេះជា PDF រូបភាពតែប៉ុណ្ណោះដោយគ្មានស្រទាប់អត្ថបទ។ នេះជាមូលហេតុ និងរបៀបដែល OCR ជួសជុលបានភ្លាមៗ។

- Source: https://pdfviz.com/km/blog/scanned-pdf-text-not-selectable
- Language: km
- Published: 2026-04-08
- Updated: 2026-04-08
- Reading time: 6 min
- Publisher: PDFviz (https://pdfviz.com)
- License: All rights reserved. Attribution required for excerpts.

---
## ហេតុអ្វីបានជាមិនអាចជ្រើសរើសអត្ថបទក្នុង PDF ដែលស្កែន?

នៅពេលឯកសារ**ត្រូវបានស្កែនដោយផ្ទាល់**ហើយរក្សាទុកជា PDF ម៉ាស៊ីនស្កែនចាប់យករូបភាពស្រទូចនៃទំព័រ - ដូចជាការថតរូប។ ឯកសារដែលទទួលបានមិនមានតួអក្សរអត្ថបទពិតប្រាកដទេ មានតែ pixels ដែលរៀបចំដូចជាអក្សរ។ នោះហើយជាមូលហេតុដែលការចុចនៅទីណាក៏ដោយក្នុងឯកសារមិនជ្រើសរើសអ្វីទាំងអស់: មិនមានស្រទាប់អត្ថបទសម្រាប់ cursor ចាប់។

នេះជាបញ្ហា PDF ទូទៅបំផុតមួយ។ ឯកសារមើលទៅអាចអានបានយ៉ាងល្អឥតខ្ចោះនៅលើអេក្រង់ ប៉ុន្តែជាចម្បងវាជារូបថតដែលបំបែកក្នុង PDF wrapper។ អ្នកមិនអាចស្វែងរក ចម្លងពី ឬអនុញ្ញាតឲ្យ screen reader វិភាគវាបានទេ។

## OCR ជាអ្វី ហើយដោះស្រាយបញ្ហានេះដូចម្តេច?

**OCR (ការស្គាល់តួអក្សរប្រើពន្លឺ)** គឺជាបច្ចេកវិទ្យាដែលវិភាគរូបភាពអត្ថបទ ហើយបំប្លែងវាទៅជាតួអក្សរពិតប្រាកដដែលអាចអានដោយម៉ាស៊ីន។ កម្មវិធីមើលរូបរាងនៃអក្សរ ប្រៀបធៀបជាមួយគំរូដែលស្គាល់ ហើយផ្តល់ស្រទាប់អត្ថបទដែលបំបែកមកវិញ PDF។

បន្ទាប់ពីដំណើរការ OCR អ្នកទទួលបាន **PDF ដែលអាចស្វែងរក និងជ្រើសរើសបាន** - ដូចគ្នាទៅនឹងដើមដោយមើលឃើញ ប៉ុន្តែឥឡូវនេះ cursor អ្នកអាចបន្លិចពាក្យ Ctrl+F អាចស្វែងរកឃ្លា ហើយការចម្លង-បិទភ្ជាប់ដំណើរការធម្មតា។ Screen reader និងឧបករណ៍ accessibility ក៏អាចអានវាដែរ។

## របៀបអនុវត្ត OCR លើ PDF ដែលស្កែន

មានវិធីជាច្រើនដើម្បីបន្ថែម OCR ទៅ PDF ដែលស្កែន ពីឧបករណ៍ browser ឥតគិតថ្លៃ រហូតដល់កម្មវិធី desktop:

- **បំប្លែងទៅ Word រួចរក្សាទុកជា PDF:** [កម្មវិធីបំប្លែង PDF ទៅ Word](https://pdfviz.com/pdf-to-word) របស់យើងស្រង់ចេញមាតិការូបភាព ហើយបំប្លែងវាទៅជាឯកសារ Word ដែលអាចកែសម្រួលបាន។ ក្នុង Word អត្ថបទអាចជ្រើសរើសបានទាំងស្រុង។ បន្ទាប់មកអ្នកអាច export ឡើងវិញទៅ PDF ដែលមានស្រទាប់អត្ថបទត្រឹមត្រូវ។
- **Adobe Acrobat (ចំណាយថ្លៃ):** ឧបករណ៍ស្តង់ដារក្នុងឧស្សាហកម្ម។ បើក PDF ចូលទៅ Tools → Scan &amp; OCR → Recognize Text ហើយ Acrobat បន្ថែមស្រទាប់អត្ថបទដោយផ្ទាល់។ ថ្លៃប៉ុន្តែមានភាពត្រឹមត្រូវខ្ពស់។
- **Google Drive (ឥតគិតថ្លៃ):** Upload PDF ដែលស្កែនទៅ Google Drive ចុចខាងស្តាំ ហើយជ្រើសរើស &quot;បើកជាមួយ Google Docs&quot; Google ដំណើរការ OCR ដោយស្វ័យប្រវត្តិ ហើយបើកអត្ថបទក្នុងឯកសារ Docs។ ដំណើរការល្អសម្រាប់ការស្កែនស្អាត។
- **Tesseract OCR (ឥតគិតថ្លៃ open-source):** ម៉ាស៊ីន OCR command-line ដ៏មានឥទ្ធិពលដែលប្រើដោយកម្មវិធីជាច្រើន។ ល្អបំផុតសម្រាប់ developer ឬអ្នកប្រើបច្ចេកទេសដែលចង់បានដំណោះស្រាយ self-hosted ឥតគិតថ្លៃ។
- **Adobe Acrobat online (ឥតគិតថ្លៃមានកម្រិត):** Adobe ផ្តល់ការដំណើរការ OCR ឥតគិតថ្លៃមានកម្រិតតាមរយៈឧបករណ៍ online របស់ពួកគេសម្រាប់អ្នកប្រើដែលគ្មានការជាវ។

## គន្លឹះដើម្បីភាពត្រឹមត្រូវ OCR ល្អប្រសើរ

គុណភាព OCR ពឹងផ្អែកខ្លាំងលើគុណភាពនៃការស្កែនដើម។ អនុវត្តតាមគន្លឹះទាំងនេះដើម្បីបង្កើតភាពត្រឹមត្រូវអតិបរមា:

- **ស្កែននៅ 300 DPI ឬខ្ពស់ជាងនេះ:** ការស្កែន resolution ទាបផ្តល់តួអក្សររញ៉ែរដែល OCR engine អានខុស។ 300 DPI គឺជាអប្បបរមា; 600 DPI ល្អសម្រាប់អត្ថបទតូច ឬឯកសារដែលមានព័ត៌មានលម្អិត។
- **ប្រើខ្មៅ-ស សម្រាប់ឯកសារអត្ថបទ:** ការស្កែនពណ៌បន្ថែមមេតាដោតឯកសារដោយគ្មានការបង្កើនភាពត្រឹមត្រូវ OCR សម្រាប់អត្ថបទធម្មតា។ ខ្មៅ-ស ឬ grayscale គ្រប់គ្រាន់សម្រាប់ឯកសារភាគច្រើន។
- **រក្សាទំព័រឲ្យតម្រង់:** ទំព័រដែលទទេ ឬលំអៀងធ្វើឲ្យ OCR software ច្របូកច្របល់។ ឧបករណ៍ទំនើបភាគច្រើនអាច auto-deskew ប៉ុន្តែការចាប់ផ្តើមត្រង់ជួយ។
- **ជៀសវាងស្នាមកាហ្វេ និងស្នាមប្រឡាក់:** សញ្ញារូបវន្តលើឯកសារត្រូវបានអានខុសជាតួអក្សរ។ សម្អាតដើមឡើយបើអាច។
- **ពិនិត្យ output:** OCR មិនត្រឹមត្រូវ 100%ទេ។ តែងតែ proofread លទ្ធផល ជាពិសេសសម្រាប់លេខ វណ្ណយុត្ត និងផ្នែកដែលសរសេរដោយដៃ។

## បន្ទាប់ពី OCR: កាត់បន្ថយទំហំឯកសារប្រសិនបើចាំបាច់

ការដំណើរការ OCR ម្តងខ្លះអាចបង្កើនទំហំឯកសារ PDF ព្រោះវាបន្ថែមស្រទាប់អត្ថបទដែលលាក់លើស្រទាប់រូបភាពដែលមានស្រាប់។ ប្រសិនបើឯកសារដែលទទួលបានមានទំហំធំពេក ប្រើ [ឧបករណ៍បង្ហាប់ PDF](https://pdfviz.com/compress-pdf) របស់យើងដើម្បីកាត់បន្ថយទំហំដោយមិនបាត់បង់គុណភាពរូបភាព។

## ចុះបើ OCR មិនស្គាល់អត្ថបទត្រឹមត្រូវ?

ភាពត្រឹមត្រូវ OCR ពឹងផ្អែកលើគុណភាពស្កែនដើម។ **លទ្ធផលមិនល្អទូទៅជាមួយ:** ពុម្ពអក្សរតូចខ្លាំង (ក្រោម 8pt) អត្ថបទសរសេរដោយដៃ ពុម្ពអក្សរតុបតែង ឬមិនធម្មតា មិនឈានធ្លុះ ឬការស្កែនគុណភាពទាបក្រោម 200 DPI។ ក្នុងករណីទាំងនេះ ការវាយឡើងវិញដោយដៃអាចចាំបាច់ - ឬស្កែនឯកសារដើមឡើយម្តងទៀតដោយមានគុណភាពខ្ពស់ជាងមុនការដំណើរការ OCR ម្តងទៀត។

## FAQ

### ហេតុអ្វីបានជាអត្ថបទក្នុង PDF របស់ខ្ញុំមិនអាចជ្រើសរើសបាន?

**PDF របស់អ្នកជារូបភាពដែលស្កែន** មិនមែនជាឯកសារដែលមានស្រទាប់អត្ថបទបំបែកទេ។ នៅពេលឯកសារក្រដាសត្រូវបានស្កែន ហើយរក្សាទុកជា PDF លទ្ធផលជាចម្បងជារូបថតនៃទំព័រ - pixels ដែលមានរូបរាងដូចអក្សរ ប៉ុន្តែមិនមែនជាអត្ថបទពិតប្រាកដ។ ដើម្បីឲ្យអាចជ្រើសរើសបាន អ្នកត្រូវដំណើរការ OCR (ការស្គាល់តួអក្សរប្រើពន្លឺ) ដើម្បីបន្ថែមស្រទាប់អត្ថបទ។

### តើមានវិធីឥតគិតថ្លៃដើម្បីធ្វើឲ្យអត្ថបទ PDF ដែលស្កែនអាចជ្រើសរើសបានទេ?

បាទ/ចាស - **Google Drive ផ្តល់ OCR ឥតគិតថ្លៃ**: upload PDF ចុចខាងស្តាំ ហើយបើកជាមួយ Google Docs។ Google ស្គាល់អត្ថបទដោយស្វ័យប្រវត្តិ។ ជំនួសមកវិញ កម្មវិធីបំប្លែង PDF ទៅ Word របស់យើងស្រង់ចេញមាតិកាទៅក្នុងឯកសារដែលអាចកែសម្រួល។ សម្រាប់ដំណោះស្រាយ desktop ឥតគិតថ្លៃទាំងស្រុង Tesseract OCR គឺ open-source ហើយមានឥទ្ធិពលខ្លាំង។

### OCR ផ្លាស់ប្តូររូបរាង PDF ទេ?

**ទេ - OCR បន្ថែមស្រទាប់អត្ថបទដែលមើលមិនឃើញ**នៅពីក្រោយរូបភាពដែលមានស្រាប់។ រូបរាងមើលឃើញនៃ PDF នៅតែដូចគ្នាបែបទំព័រ។ អ្នកទទួលបានតែសមត្ថភាពក្នុងការជ្រើសរើស ចម្លង និងស្វែងរកអត្ថបទ។ ករណីលើកលែងតែមួយគត់គឺប្រសិនបើអ្នកបំប្លែងទៅ Word ហើយ export ឡើងវិញ ដែលការផ្លាស់ប្តូរ formatting តូចប្រហែលជាកើតឡើង។

### OCR ត្រឹមត្រូវប៉ុណ្ណាលើឯកសារដែលស្កែន?

OCR ទំនើបមាន**ភាពត្រឹមត្រូវ 95-99% លើឯកសារស្អាត ស្កែនបានល្អ**នៅ 300 DPI ឬខ្ពស់ជាងនេះ។ ភាពត្រឹមត្រូវថយចុះយ៉ាងខ្លាំងសម្រាប់ការស្កែន resolution ទាប អក្សរដៃ ពុម្ពអក្សរមិនធម្មតា ឬទំព័រដែលខូចដោយរូបវន្ត។ តែងតែ proofread output មុននឹងពឹងផ្អែកលើវាសម្រាប់ឯកសារសំខាន់។

### តើខ្ញុំអាចធ្វើឲ្យអត្ថបទសរសេរដោយដៃក្នុង PDF ជ្រើសរើសបានជាមួយ OCR ទេ?

**OCR ស្តង់ដារធ្វើការមិនល្អលើអក្សរដៃ** - វាត្រូវបានរចនាឡើងសម្រាប់អត្ថបទបោះពុម្ព និងវាយ។ ឧបករណ៍ស្គាល់អក្សរដៃជាក់លាក់មានប៉ុន្តែតិចជាងភ្លោះ OCR អត្ថបទបោះពុម្ព។ ប្រសិនបើឯកសារមានការបោះពុម្ព និងអក្សរដៃ OCR នឹងស្គាល់ផ្នែកបោះពុម្ពបានត្រឹមត្រូវ ប៉ុន្តែទំនងជាអានខុសផ្នែកអក្សរដៃ។
