Saya menggunakan CAJViewer
CAJViewer5.5_OCR v5.5.0 Binaan 4030
Penerangan: Dengan pengecaman OCR dan pakej berbilang bahasa, pengecaman OCR menyokong pengecaman bahasa Cina dan Inggeris. Saiz: 32.911 MB
1) Pengecaman teks separa: terus gunakan ocr penyemak imbas caj
Simpan fail cetakan dalam format MDI dan kemudian buka fail menggunakan Imej Dokumen Microsoft Office. Pilih "Gunakan OCR untuk mengecam teks" di bawah menu Alat untuk mengenal pasti kandungan teks. Selepas melengkapkan pengiktirafan, pilih "Hantar Teks ke Word" di bawah menu Alat untuk mengeluarkan hasil pengecaman keseluruhan fail PDF ke fail Word.
Sila ambil perhatian: Imej Dokumen Microsoft Office boleh mengecam dan menukar kandungan bahasa Cina, Inggeris dan jadual dengan sangat tepat. Walau bagaimanapun, ia tidak boleh mengeluarkan grafik secara langsung kepada dokumen Word Sebaliknya, ia membentuk semua grafik dalam fail menjadi fail gambar bebas dan meletakkannya dalam folder yang sama dengan nama folder yang sama dengan fail asal. Oleh itu, anda boleh menggunakan perisian Snagit untuk membuka fail grafik ini dan menyalin dan menampalnya ke dalam Word. (Perlu diingatkan bahawa semua perisian pengecaman tidak dapat menangani masalah pengecaman corak dengan baik, dan kaedah pemprosesan Imej Dokumen Microsoft Office sudah menjadi salah satu penyelesaian terbaik untuk menyelesaikan masalah ini pada masa ini.)
Kaedah cepat yang disyorkan:
Sebelum mengekstrak teks daripada fail CAJ, persediaan berikut diperlukan: Pertama, pastikan pelayar fail CAJ 5.5 dan Office2003 dipasang, dan alat Office Pengimejan Dokumen Microsoft Office dipasang sepenuhnya. Setelah pemasangan selesai, anda akan melihat pencetak Microsoft Office Document Image Writer dalam senarai pencetak. Dengan Imej Dokumen Microsoft Office, anda boleh mengecam dan menukar kandungan dokumen Cina, Inggeris, jadual dan dokumen lain dengan ketepatan yang tinggi. Persediaan ini boleh memastikan anda berjaya mengekstrak maklumat teks dalam fail CAJ.
Pengiktirafan fail CAJ:
(1) Mula-mula, muat turun fail data format CAJ daripada Internet dan simpan ke pemacu keras tempatan anda.
(2) Kemudian, mulakan program penyemak imbas CAJViewer dan buka fail format CAJ yang baru anda simpan dalam program tersebut. Selepas menyemak imbas fail ke halaman terakhir, jangan tutup program penyemak imbas CAJ.
(3) Dalam tetingkap program penyemak imbas CAJ, pilih "Fail" → "Cetak", dan pilih pencetak sebagai pencetak Microsoft Office Document Image Writer, semak pilihan cetak ke fail dan tentukan bilangan halaman untuk dicetak.
(4) Simpan fail cetakan (*.prn) ke lokasi yang sesuai. Selepas menunggu pencetakan selesai, Imej Dokumen Microsoft Office secara automatik membuka fail cetakan yang baru anda simpan.
(5) Dalam tetingkap Imej Dokumen Microsoft Office, pilih item menu "Pilih Semua Halaman" dalam menu "Halaman", dan kemudian pilih "Gunakan OCR untuk Mengecam Teks" dalam menu "Alat" untuk mengekstrak teks.
(6) Pilih "Hantar teks ke perkataan" di bawah "Alat", dan akhirnya keseluruhan pengecaman fail CAJ akan dikeluarkan kepada fail perkataan.
Kadangkala apabila anda membuka dokumen Word, anda mungkin melihat bahawa dokumen itu telah menjadi sekumpulan aksara yang bercelaru. Jangan risau, anda boleh mencuba dua kaedah berikut untuk menyimpan fail anda.
1. Kaedah format gantian .heike123.com
Simpan dokumen Word yang rosak ke dalam format lain.
1. Buka dokumen yang rosak dan klik menu "Fail/Simpan Sebagai" Dalam senarai "Jenis Simpan", pilih "Format RTF", kemudian klik butang "Simpan" dan tutup Word.
2. Buka fail format RTF yang baru anda simpan, dan gunakan "Save As" sekali lagi untuk menyimpan fail sebagai "Word Document".
Jika fail masih tidak dapat dipulihkan selepas menukarnya kepada format rtf, anda boleh menukar fail itu kepada format teks biasa (*.txt) sekali lagi dan kemudian menukarnya semula kepada format Word. Sudah tentu, gambar dan maklumat lain akan hilang apabila menukar kepada fail txt.
Sesetengah fail PDF akan bercelaru apabila ditukar kepada dokumen perkataan Saya telah menggunakan banyak perisian penukaran, tetapi teksnya masih bercelaru. Untuk menyelesaikan masalah ini, saya menggunakan kaedah bodoh berikut:
1. Klik dua kali untuk membuka fail PDF Sudah tentu, anda mesti memuat turun dan memasang penukar PDF terlebih dahulu
2. Tukar teks Cina dalam PDF kepada dokumen perkataan yang boleh diedit Caranya ialah: (dalam fail PDF yang dibuka) klik: Fail-Simpan Sebagai, dan selepas "Simpan sebagai jenis", pilih: "Fail TXT (*.txt)". , pilih "Desktop" selepas "Simpan dalam", klik "Simpan", buka dokumen txt pada desktop (dengan nama yang sama dengan PDF), pilih teks, salin dan tampalkannya ke dalam dokumen perkataan.
3 Salin gambar dalam PDF ke dokumen perkataan Caranya ialah: (dalam fail PDF yang terbuka) klik: Tools-Snapshot (jika gambar lebih besar, sila klik alat "Reduce" di baris kedua sehingga anda. boleh melihatnya. ke seluruh gambar), pilih gambar (tekan dan tahan butang kiri tetikus di sudut kiri atas gambar, seret ke sudut kanan bawah, kotak bertitik akan muncul pada masa ini, lepaskan tetikus), dan klik butang yang sesuai dalam dokumen perkataan terbuka Tampal dalam kedudukan (Ctrl+V).
4 Pada masa ini, anda boleh mengedit teks dalam dokumen perkataan mengikut apa yang anda mahukan.
2 di atas juga boleh dilakukan seperti ini: (dalam fail PDF yang terbuka), klik: Tools-Text Viewer (teks dalam PDF sudah dalam bentuk teks), kemudian klik kanan "Pilih Semua"-"Salin" kepada perkataan Hanya klik "Tampal". Walaupun kaedah ini adalah halaman demi halaman, ia boleh serupa dengan reka letak asal dalam dokumen perkataan. Kemudian klik: Alat-Teks Viewer (anda juga boleh mengklik Alt+9 berulang kali) untuk memasuki antara muka pembaca PDF (atau antara muka teks).
Langkah untuk menggunakan penukar PDF ke Word dalam talian:
Langkah pertama: Muat naik fail PDF yang perlu ditukar. Ia akan menunjukkan bahawa fail yang anda muat naik itu berjaya Klik untuk menghasilkan dokumen perkataan
Langkah 2: Tunggu pemprosesan pelayanLangkah 3: Muat turun dokumen perkataan dan simpan pada komputer anda.
Atas ialah kandungan terperinci Mengapa fail pdf dibuka menggunakan pemapar pdf memaparkan aksara bercelaru?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!