Dengan kemunculan era digital, banyak syarikat dan individu perlu mendigitalkan dokumen kertas. Teknologi pengecaman OCR (Optical Character Recognition, optical character recognition) merupakan salah satu kaedah yang berkesan untuk menyelesaikan masalah ini. PHP, sebagai bahasa sebelah pelayan yang popular, juga menyediakan beberapa perpustakaan dan alatan untuk pengecaman OCR. Artikel ini akan memperkenalkan berbilang teknologi pengecaman OCR dalam PHP untuk memilih penyelesaian yang paling sesuai.
1. tesseract-ocr
tesseract-ocr ialah perpustakaan enjin OCR sumber terbuka popular yang ditulis dalam C++. PHP menyediakan integrasi dengan tesseract-ocr. Imej dalam PDF, JPEG, GIF, PNG dan format lain boleh dikenali melalui php-ext-tesseract. Ciri terbesar tesseract-ocr ialah ia direka untuk berbilang bahasa dan boleh mengecam teks dalam kebanyakan bahasa di dunia.
Penggunaan:
<?php require_once __DIR__.'/vendor/autoload.php'; use thiagoalessioTesseractOCRTesseractOCR; $result = (new TesseractOCR('example.png')) ->run(); echo $result; ?>
2. OCRopus
OCRopus ialah satu set alat dan perpustakaan OCR serta enjin OCR yang popular, yang berasaskan Python. OCRopus boleh menggunakan operasi pengikatan PHP. Ia bukan sahaja menyokong pengecaman teks, tetapi juga melaksanakan tugas pemprosesan OCR yang komprehensif seperti pengelasan dokumen, pembahagian dan penetapan taip.
Penggunaan:
<?php $image = new Imagick(); $image->readImage('example.png'); $image->setImageFormat('tif'); $image->thresholdImage(127); //图像二值化 $data = $image->getImagesBlob(); $ocr = new esseractOCR($data); echo $ocr->run(); ?>
3. Google Cloud Vision OCR
Google Cloud Vision API ialah set alat penglihatan mesin yang menyepadukan perkhidmatan OCR. API ini menyediakan keupayaan penglihatan komputer dan pengecaman imej Google Cloud Vision OCR boleh membantu kami mengenal pasti teks dan aksara dalam imej. Perlu diingat bahawa menggunakan perkhidmatan ini memerlukan pendaftaran akaun Google dan mendapatkan kunci API, dan bilangan penggunaan akan dikenakan bayaran.
Penggunaan:
<?php require_once __DIR__ . '/vendor/autoload.php'; use GoogleCloudVisionV1ImageAnnotatorClient; $imageAnnotator = new ImageAnnotatorClient(); try { # 图像文件的本地路径或者 URL 地址,即待识别的图像文件路径 $image = file_get_contents('https://example.com/image.jpg'); # 构建图像标注请求 $response = $imageAnnotator->documentTextDetection($image); # 输出结果 foreach ($response->getTextAnnotations() as $text) { printf('%s' . PHP_EOL, $text->getDescription()); } } catch (Exception $exception) { echo $exception->getMessage(); } ?>
Di atas ialah tiga teknologi OCR yang popular dalam PHP. Sudah tentu, kami juga boleh menggunakan perpustakaan atau API lain untuk pengecaman imej OCR. Setiap teknologi ini mempunyai kelebihan dan kekurangannya dan perlu dipilih berdasarkan keperluan tertentu. Tidak kira kaedah yang anda pilih, kaedah ini boleh membantu kami mendigitalkan dokumen kertas dengan cepat dan tepat, meningkatkan kecekapan kerja, mengurangkan kos dan membawa nilai sebenar kepada perniagaan dan individu.
Atas ialah kandungan terperinci Panduan teknologi pengecaman OCR dalam PHP. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!