PHP를 사용하여 기본 OCR 및 이미지 인식을 수행하는 방법

WBOY
풀어 주다: 2023-06-22 10:24:02
원래의
2131명이 탐색했습니다.

인공지능 분야의 지속적인 발전과 함께 이미지 인식 기술은 점점 더 성숙해지고 대중화되고 있습니다. 실제 응용 분야에서 이미지 콘텐츠를 빠르고 효율적으로 식별하는 방법은 많은 개발자와 연구자가 직면한 문제가 되었습니다. 그 중 OCR(광학 문자 인식) 기술이 널리 사용되는데, 이는 사진 속 텍스트를 식별하고 편집 가능한 텍스트 형식으로 변환하여 후속 처리를 용이하게 할 수 있습니다.

이 기사에서는 PHP를 사용하여 OCR 및 이미지 인식의 기본 작업을 수행하는 방법을 소개합니다.

준비

OCR 및 이미지 인식에 PHP를 사용하려면 먼저 관련 라이브러리와 확장 프로그램을 설치해야 합니다. 여기서는 tesseract를 설치 예로 들어 보겠습니다.

  1. tesseract 설치

tesseract는 여러 언어의 텍스트를 인식할 수 있는 오픈 소스 OCR 엔진입니다. Linux 시스템에서는 다음 명령을 통해 설치할 수 있습니다:

sudo apt-get install tesseract-ocr
sudo apt-get install libtesseract-dev
로그인 후 복사
  1. PHP 확장 설치

PHP에서 tesseract를 사용하려면 php-ocr 확장을 설치해야 합니다. Linux 시스템에서는 다음 명령을 통해 설치할 수 있습니다.

sudo apt-get install php-dev
sudo apt-get install php-pear
sudo apt-get install libtesseract-dev
sudo pecl install ocr-alpha
로그인 후 복사

설치가 완료된 후 php.ini 파일에 다음 구성을 추가합니다.

extension=ocr.so
로그인 후 복사

사용 방법

  1. 간단한 OCR 인식

다음 tesseract를 이용한 OCR 인식의 간단한 사용 예:

<?php
    $img_file = 'test.png';
    $text = (new OCRTesseractOCR($img_file))
            ->run();
    echo $text;
?>
로그인 후 복사

위 코드에서는 먼저 이미지 파일 test.png를 정의한 후 tesseract를 사용하여 인식을 수행하고 결과를 출력합니다.

  1. 이미지 처리 및 인식

이미지를 처리한 다음 인식해야 하는 경우 PHP 및 GD 라이브러리를 사용하여 이를 달성할 수 있습니다.

다음은 이미지 처리 및 OCR 인식 수행의 예입니다.

<?php
    $img_file = 'test.png';
    $img = imagecreatefrompng($img_file);
    
    // 图像处理操作
    $width = imagesx($img);
    $height = imagesy($img);
    $gray_img = imagecreatetruecolor($width, $height);
    for($i = 0; $i < $width; ++$i) {
        for($j = 0; $j < $height; ++$j) {
            $rgb = imagecolorat($img, $i, $j);
            $r = ($rgb >> 16) & 0xFF;
            $g = ($rgb >> 8) & 0xFF;
            $b = $rgb & 0xFF;
            $gray = intval(0.30 * $r + 0.59 * $g + 0.11 * $b);
            imagesetpixel($gray_img, $i, $j, ($gray << 16) | ($gray << 8) | $gray);
        }
    }
    $gray_file = 'gray.png';
    imagepng($gray_img, $gray_file);
    
    $text = (new OCRTesseractOCR($gray_file))
            ->run();
    echo $text;
?>
로그인 후 복사

위 코드에서는 먼저 GD 라이브러리의 imagecreatefrompng 함수를 사용하여 이미지를 읽은 다음 이미지 처리 작업을 수행합니다. 회색조 이미지로 변환합니다. 처리가 완료되면 OCR 인식을 위해 tesseract를 사용합니다.

요약

OCR 및 이미지 인식에 PHP를 사용하면 이미지 콘텐츠를 편집 가능한 텍스트 형식으로 쉽게 변환하여 후속 처리 및 분석을 위한 기본 데이터를 제공할 수 있습니다. 이 기사에서는 간단한 이미지 인식 및 처리를 위해 tesseract 및 GD 라이브러리를 사용하는 방법을 소개합니다. 독자는 실제 필요에 따라 추가로 개발할 수 있습니다.

위 내용은 PHP를 사용하여 기본 OCR 및 이미지 인식을 수행하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

관련 라벨:
원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿