人工知能分野の継続的な発展に伴い、画像認識技術はますます成熟し、普及してきました。実際のアプリケーションでは、画像コンテンツをいかに迅速かつ効率的に識別するかが、多くの開発者や研究者が直面する問題となっています。中でも OCR (光学文字認識) 技術は広く使用されており、写真内のテキストを識別し、その後の処理を容易にするために編集可能なテキスト形式に変換できます。
この記事では、PHP を使用して OCR と画像認識の基本的な操作を実行する方法を紹介します。
準備
OCR や画像認識に PHP を使用するには、まず関連するライブラリと拡張機能をインストールする必要があります。ここでは例として tesseract をインストールします。
tesseract は、複数の言語のテキストを認識できるオープンソースの OCR エンジンです。 Linux システムでは、次のコマンドを使用してインストールできます:
sudo apt-get install tesseract-ocr sudo apt-get install libtesseract-dev
PHP で tesseract を使用するには、php- ocr拡張子。 Linux システムでは、次のコマンドを使用してインストールできます:
sudo apt-get install php-dev sudo apt-get install php-pear sudo apt-get install libtesseract-dev sudo pecl install ocr-alpha
インストールが完了したら、php.ini ファイルに次の設定を追加します:
extension=ocr.so
Usage
以下は、OCR 認識に tesseract を使用する簡単な例です:
<?php $img_file = 'test.png'; $text = (new OCRTesseractOCR($img_file)) ->run(); echo $text; ?>
上記のコードでは、最初に画像ファイル test.png を定義します。 、そして tesseract を使用すると、結果が認識されて出力されます。
画像を処理して認識する必要がある場合は、PHP と GD ライブラリを使用してそれを実現できます。
次は、画像の処理と OCR 認識の実行の例です:
<?php $img_file = 'test.png'; $img = imagecreatefrompng($img_file); // 图像处理操作 $width = imagesx($img); $height = imagesy($img); $gray_img = imagecreatetruecolor($width, $height); for($i = 0; $i < $width; ++$i) { for($j = 0; $j < $height; ++$j) { $rgb = imagecolorat($img, $i, $j); $r = ($rgb >> 16) & 0xFF; $g = ($rgb >> 8) & 0xFF; $b = $rgb & 0xFF; $gray = intval(0.30 * $r + 0.59 * $g + 0.11 * $b); imagesetpixel($gray_img, $i, $j, ($gray << 16) | ($gray << 8) | $gray); } } $gray_file = 'gray.png'; imagepng($gray_img, $gray_file); $text = (new OCRTesseractOCR($gray_file)) ->run(); echo $text; ?>
上記のコードでは、最初に GD ライブラリの imagecreatefrompng 関数を使用して画像を読み取り、次に image画像をグレースケールに変換します。処理が完了したらtesseractを使ってOCR認識を行います。
概要
PHP を OCR と画像認識に使用すると、画像コンテンツを編集可能なテキスト形式に簡単に変換し、その後の処理と分析のための基本データを提供できます。この記事では、tesseract と GD ライブラリを使用して簡単な画像認識と処理を行う方法を紹介しますので、読者は実際のニーズに応じてさらに開発することができます。
以上がPHP を使用して基本的な OCR と画像認識を行う方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。