デジタル時代の到来により、多くの企業や個人は紙の文書をデジタル化する必要があります。 OCR(Optical Character Recognition、光学式文字認識)認識技術は、この問題を解決する有効な方法の 1 つです。 PHP は、一般的なサーバーサイド言語として、OCR 認識用のライブラリとツールもいくつか提供しています。この記事では、最適なソリューションを選択するために、PHP の複数の OCR 認識テクノロジを紹介します。
1. tesseract-ocr
tesseract-ocr は、C で書かれた人気のオープンソース OCR エンジン ライブラリです。 PHP は tesseract-ocr との統合を提供します。 PDF、JPEG、GIF、PNG およびその他の形式の画像は、php-ext-tesseract を通じて認識できます。 tesseract-ocrの最大の特徴は、多言語対応に設計されており、世界中のほとんどの言語のテキストを認識できることです。
使用法:
<?php require_once __DIR__.'/vendor/autoload.php'; use thiagoalessioTesseractOCRTesseractOCR; $result = (new TesseractOCR('example.png')) ->run(); echo $result; ?>
2. OCRopus
OCRopus は、Python をベースにした OCR ツールとライブラリ、および人気のある OCR エンジンのセットです。 OCRopus は PHP バインディング操作を使用できます。テキスト認識をサポートするだけでなく、文書の分類、セグメンテーション、植字などの包括的な OCR 処理タスクも実行します。
使用法:
<?php $image = new Imagick(); $image->readImage('example.png'); $image->setImageFormat('tif'); $image->thresholdImage(127); //图像二值化 $data = $image->getImagesBlob(); $ocr = new esseractOCR($data); echo $ocr->run(); ?>
3. Google Cloud Vision OCR
Google Cloud Vision API は、OCR サービスを統合するマシン ビジョン ツールのセットです。この API は、コンピューター ビジョン機能と画像認識を提供します。Google Cloud Vision OCR は、画像内のテキストや文字の識別に役立ちます。なお、このサービスの利用にはGoogleアカウントの登録とAPIキーの取得が必要で、利用回数に応じて課金される。
使用法:
<?php require_once __DIR__ . '/vendor/autoload.php'; use GoogleCloudVisionV1ImageAnnotatorClient; $imageAnnotator = new ImageAnnotatorClient(); try { # 图像文件的本地路径或者 URL 地址,即待识别的图像文件路径 $image = file_get_contents('https://example.com/image.jpg'); # 构建图像标注请求 $response = $imageAnnotator->documentTextDetection($image); # 输出结果 foreach ($response->getTextAnnotations() as $text) { printf('%s' . PHP_EOL, $text->getDescription()); } } catch (Exception $exception) { echo $exception->getMessage(); } ?>
上記は、PHP でよく使用される 3 つの OCR テクノロジです。もちろん、OCR 画像認識に他のライブラリや API を使用することもできます。これらのテクノロジーにはそれぞれ長所と短所があり、特定のニーズに基づいて選択する必要があります。どの方法を選択しても、紙の文書を迅速かつ正確にデジタル化し、作業効率を向上させ、コストを削減し、企業や個人に真の価値をもたらすのに役立ちます。
以上がPHP の OCR 認識テクノロジー ガイドの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。