디지털 시대의 지속적인 발전으로 인해 많은 양의 종이 문서가 저장 및 검색을 용이하게 하기 위해 디지털화되어야 합니다. 데이터를 효과적으로 변환하기 위해 많은 기업과 개인은 스캔한 종이 문서의 텍스트를 디지털 형식으로 변환할 수 있는 OCR(광학 문자 인식, 광학 문자 인식) 기술을 선택합니다.
PHP는 일반적으로 사용되는 프로그래밍 언어로 OCR 인식 및 텍스트 인식에도 사용할 수 있습니다. 이번 글에서는 OCR 인식과 텍스트 인식을 위해 PHP를 사용하는 방법을 소개하겠습니다.
1. PHP OCR 인식
PHP에서 OCR 인식을 수행하려면 일부 OCR 인식 라이브러리를 사용하면 됩니다. 현재 더 일반적으로 사용되는 것에는 Tesseract OCR, OCRopus 등이 있습니다.
Tesseract OCR은 가장 유명한 무료 OCR(광학 문자 인식, 광학 문자 인식) 엔진 중 하나입니다. HP Labs에서 개발했으며 현재 Google에서 관리하고 있습니다. Tesseract는 여러 플랫폼(예: Windows, Mac OS 및 Linux)과 여러 프로그래밍 언어(예: C++, Python 및 Java)에서 사용할 수 있습니다.
다음은 Tesseract OCR을 사용하여 이미지를 인식하는 간단한 PHP 예입니다.
// Tesseract OCR 엔진 및 PHP Tesseract OCR 패키지 설치
apt-get install tesseract- ocr
composer는 thiagoalessio/tesseract_ocr
// 이미지 로드
$image = new Imagick('path/to/image');
//에서 텍스트 인식 image
$tesseract = new TesseractOCR();
$tesseract->image($image);
$text = $tesseract->run();
echo $text;// 인식된 텍스트 출력
2 . PHP 텍스트 인식
PHP에서 텍스트 인식을 수행하려면 일부 텍스트 인식 라이브러리를 사용하면 됩니다. 현재 더 일반적으로 사용되는 것에는 IDA S.E OCR, Nanonets OCR 등이 있습니다.
패키지마다 설치 방법과 사용 방법이 다르기 때문에 Nanonets OCR을 예로 들면 다음은 Nanonets OCR을 사용하여 이미지의 텍스트를 식별하는 간단한 PHP 예입니다.
// 계정 등록, API 키 및 모델 ID 받기
https://app.nanonets.com/user/register
//PHP SDK 설치
composer require nanonets/nanonets- ocr-php
// Nanonets OCR에서 인식 결과 가져오기
require_once(__DIR__ . '/vendor/autoload.php');
$api_key = 'YOUR API KEY' ;
$model_id = '모델 ID';
$nocr = 새로운 NanonetsOCRNanonetsOCR($api_key, $model_id);
$result = $nocr->upload('path/to/image');
echo $result ;
//분석 결과
$json = json_decode($result, true);
$text = '';
foreach($json['result' ][0 ]['prediction'] as $line) {
$text .= $line['ocr_text'] . "
";
}
echo $text;
Summary
위의 두 예를 통해 OCR 인식과 텍스트 인식에 PHP를 사용하는 것을 볼 수 있습니다. 매우 간단합니다. 해당 라이브러리(예: Tesseract OCREngine, OCRopus, Nanonets OCR 등)를 설치하고 이미지를 로드하거나 업로드한 다음 OCR 기술과 텍스트 인식 기술을 사용하면 많은 수를 디지털화할 수 있습니다. 그러나 실제 응용에서는 프로젝트에 적합한 OCR 라이브러리를 선택하고 실제 요구에 따라 구현해야 한다는 점에 유의해야 합니다.
위 내용은 OCR 인식 및 텍스트 인식에 PHP를 사용하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!