


Menggunakan PHP dan Tesseract untuk melaksanakan fungsi pengecaman teks imej OCR
Dengan perkembangan pesat kecerdasan buatan dan teknologi penglihatan komputer, OCR (Optical Character Recognition), sistem pengecaman aksara optik, telah menjadi semakin matang dan telah menjadi fungsi yang diperlukan dalam banyak senario aplikasi. Sistem OCR boleh mengecam teks dalam imej supaya maklumat dalam imej boleh diproses secara digital dan dianalisis secara bijak. Artikel ini akan memperkenalkan cara menggunakan PHP dan Tesseract untuk melaksanakan fungsi pengecaman teks imej OCR.
1. Pengenalan kepada Tesseract
Tesseract ialah enjin OCR sumber terbuka yang dibangunkan oleh HP Labs dan disumbangkan kepada komuniti sumber terbuka. Ia menyokong berbilang bahasa, mempunyai pengiktirafan yang tinggi dan ketepatan yang tinggi. Versi terkini Tesseract ialah 4.1.1.
2. Konfigurasikan persekitaran dan pasang Tesseract
- Pasang PHP
Mula-mula anda perlu memasang PHP secara setempat atau pada pelayan. Jika persekitaran XAMPP atau WAMP sudah dipasang pada mesin ini, anda boleh terus menggunakan php yang disertakan dengan xampp atau wamp Jika tidak, anda perlu memasangnya secara manual.
- Pasang Tesseract
Muat turun Tesseract dari laman web rasmi https://github.com/tesseract-ocr/tesseract Pilih muat turun mengikut sistem pengendalian yang anda gunakan. Pasang selepas muat turun selesai. Jika anda perlu menggunakan bahasa Cina, anda juga perlu memuat turun pek bahasa yang sepadan.
Laksanakan tesseract --versi dalam tetingkap baris arahan untuk mengesahkan sama ada Tesseract berjaya dipasang.
3. Gunakan PHP dan Tesseract untuk melaksanakan fungsi pengecaman teks imej OCR
- Pasang PHP dan pasang Tesseract
Pertama, anda perlu memasang PHP dan memasang Tesseract.
2. Lulus dalam laluan imej dan laksanakan pengecaman arahan
Gunakan fungsi exec (atau shell_exec() atau system()) untuk melaksanakan arahan untuk mengecam teks dalam imej. Parameter yang diluluskan adalah parameter arahan yang diperlukan oleh Tesseract, di mana "chi_sim" ialah bahasa yang akan diiktiraf dan boleh diubah suai mengikut keperluan.
$command = "tesseract " $image_path ." " .$output_path." -l chi_sim"; ) fungsi memperoleh hasil pengiktirafan akhir dan mengembalikannya.
if (file_exists($output_path.'.txt')) {
$content = file_get_contents($output_path.'.txt'); //返回识别结果 return $content;
- }4 Test
Berikut ialah contoh mudah untuk menguji sama ada fungsi pengecaman teks imej OCR berfungsi dengan betul.
(1) Mula-mula anda perlu menyediakan gambar, di sini kami menggunakan gambar yang mengandungi teks bahasa Cina.
(2) Lulus laluan imej untuk dikenali dan laluan hasil output ke dalam fungsi Kod adalah seperti berikut:
function ocr($image_path, $output_path) {
$command = "tesseract ". $image_path ." " .$output_path." -l chi_sim"; //执行命令 exec($command); if (file_exists($output_path.'.txt')) { $content = file_get_contents($output_path.'.txt'); //返回识别结果 return $content; }
}
(3) Panggil. fungsi dan keluarkan hasilnya, Kodnya adalah seperti berikut:
$image_path = './test.jpg';
$output_path = './test'; echo $result;(4) Jalankan program Jika semuanya berjalan lancar, keputusan berikut akan dikeluarkan: "Ini adalah gambar ujian yang mengandungi teks bahasa Cina 5. Ringkasan
Melalui pengenalan ini." artikel, pembaca boleh memahami cara menggunakan PHP dan Tesseract untuk melaksanakan fungsi pengecaman teks Imej OCR. Untuk sesetengah senario aplikasi yang memerlukan pengecaman teks imej, pengekstrakan teks yang cepat dan tepat boleh dicapai, meningkatkan kecekapan dan ketepatan kerja. Sudah tentu, dalam senario aplikasi yang berbeza, kita perlu mengubah suai dan mengoptimumkan kod mengikut keperluan sebenar untuk benar-benar mencapai hasil yang lebih baik.
Atas ialah kandungan terperinci Menggunakan PHP dan Tesseract untuk melaksanakan fungsi pengecaman teks imej OCR. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

Video Face Swap
Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas





PHP 8.4 membawa beberapa ciri baharu, peningkatan keselamatan dan peningkatan prestasi dengan jumlah penamatan dan penyingkiran ciri yang sihat. Panduan ini menerangkan cara memasang PHP 8.4 atau naik taraf kepada PHP 8.4 pada Ubuntu, Debian, atau terbitan mereka

Jika anda seorang pembangun PHP yang berpengalaman, anda mungkin merasakan bahawa anda telah berada di sana dan telah melakukannya. Anda telah membangunkan sejumlah besar aplikasi, menyahpenyahpepijat berjuta-juta baris kod dan mengubah suai sekumpulan skrip untuk mencapai op

Kod Visual Studio, juga dikenali sebagai Kod VS, ialah editor kod sumber percuma — atau persekitaran pembangunan bersepadu (IDE) — tersedia untuk semua sistem pengendalian utama. Dengan koleksi sambungan yang besar untuk banyak bahasa pengaturcaraan, Kod VS boleh menjadi c

JWT adalah standard terbuka berdasarkan JSON, yang digunakan untuk menghantar maklumat secara selamat antara pihak, terutamanya untuk pengesahan identiti dan pertukaran maklumat. 1. JWT terdiri daripada tiga bahagian: header, muatan dan tandatangan. 2. Prinsip kerja JWT termasuk tiga langkah: menjana JWT, mengesahkan JWT dan muatan parsing. 3. Apabila menggunakan JWT untuk pengesahan di PHP, JWT boleh dijana dan disahkan, dan peranan pengguna dan maklumat kebenaran boleh dimasukkan dalam penggunaan lanjutan. 4. Kesilapan umum termasuk kegagalan pengesahan tandatangan, tamat tempoh, dan muatan besar. Kemahiran penyahpepijatan termasuk menggunakan alat debugging dan pembalakan. 5. Pengoptimuman prestasi dan amalan terbaik termasuk menggunakan algoritma tandatangan yang sesuai, menetapkan tempoh kesahihan dengan munasabah,

Tutorial ini menunjukkan cara memproses dokumen XML dengan cekap menggunakan PHP. XML (bahasa markup extensible) adalah bahasa markup berasaskan teks yang serba boleh yang direka untuk pembacaan manusia dan parsing mesin. Ia biasanya digunakan untuk penyimpanan data

Rentetan adalah urutan aksara, termasuk huruf, nombor, dan simbol. Tutorial ini akan mempelajari cara mengira bilangan vokal dalam rentetan yang diberikan dalam PHP menggunakan kaedah yang berbeza. Vokal dalam bahasa Inggeris adalah a, e, i, o, u, dan mereka boleh menjadi huruf besar atau huruf kecil. Apa itu vokal? Vokal adalah watak abjad yang mewakili sebutan tertentu. Terdapat lima vokal dalam bahasa Inggeris, termasuk huruf besar dan huruf kecil: a, e, i, o, u Contoh 1 Input: String = "TutorialSpoint" Output: 6 menjelaskan Vokal dalam rentetan "TutorialSpoint" adalah u, o, i, a, o, i. Terdapat 6 yuan sebanyak 6

Mengikat statik (statik: :) Melaksanakan pengikatan statik lewat (LSB) dalam PHP, yang membolehkan kelas panggilan dirujuk dalam konteks statik dan bukannya menentukan kelas. 1) Proses parsing dilakukan pada masa runtime, 2) Cari kelas panggilan dalam hubungan warisan, 3) ia boleh membawa overhead prestasi.

Apakah kaedah sihir PHP? Kaedah sihir PHP termasuk: 1. \ _ \ _ Membina, digunakan untuk memulakan objek; 2. \ _ \ _ Destruct, digunakan untuk membersihkan sumber; 3. \ _ \ _ Call, mengendalikan panggilan kaedah yang tidak wujud; 4. \ _ \ _ Mendapatkan, melaksanakan akses atribut dinamik; 5. \ _ \ _ Set, melaksanakan tetapan atribut dinamik. Kaedah ini secara automatik dipanggil dalam situasi tertentu, meningkatkan fleksibiliti dan kecekapan kod.
