이 기사는 이미지 텍스트 인식을 구현하는 Python 코드를 공유합니다. 내용이 꽤 좋습니다. 도움이 필요한 친구들에게 도움이 되기를 바랍니다.
시 인식을 예로 들어 보겠습니다.
다음은 우리가 원하는 이미지입니다. to recognition
코드를 실행한 후 인식 결과, 제대로 인식되지 않는 단어가 몇 개 있지만 대부분의 단어는 인식됩니다.
风急天高猿啸哀 渚芸胄芳少白鸟飞凤 无边落木萧萧下, 不尽长量工盲衮宕衮来 万里悲秋常1乍窨, 百年多病独登氤 艰难苦恨擎霜量 漂倒新停澍酉帆
여기서 두 개의 라이브러리, pytesseract 및 PIL을 사용해야 합니다.
동시에 설치도 해야 합니다. 인식 엔진 tesseract-ocr
pip
- 1. 명령줄 설치
pip install PIL
pip install pytesseract
- 2. pycharm 편집기를 사용하는 경우 pycharm을 직접 사용하여 빠른 설치를 수행할 수 있습니다.
pycharm의 설정 페이지에서 다음 단계를 따르세요
이 방법으로 pytesseract를 성공적으로 설치할 수 있습니다. PIL을 설치하려면 위의 세 번째 단계에서 PIL을 검색하고 설치
를 클릭하기만 하면 됩니다. 라이브러리를 설치하고 다음 코드
from PIL import Image import pytesseract text=pytesseract.image_to_string(Image.open('denggao.jpeg'),lang='chi_sim') print(text)
를 실행하면 다음 오류가 보고됩니다. 오류 원인은 다음과 같습니다. 인식 엔진 tesseract-ocr이 설치되지 않았습니다
1. 아래 설치 패키지를 다운로드한 후 바로 클릭하여
tesseract-ocr 설치 패키지와 중국어 패키지
압축을 풀고 tesseract-ocr을 설치한 후 다음 작업을 수행하여 중국어 인식을 지원하세요. tesseract-ocr은 기본적으로 중국어 인식을 지원하지 않기 때문입니다.
2. TesserAct-Acr을 사용한 후에도 여전히 일부 구성을 수행해야합니다. C : UsersHuxiAppDataloCalProgramSpythonpyThon35libsite-PackagesPyTesserAct를 열고 다음 작업을 수행하고 다음 작업을 수행 할 수 있습니다. pycharm.py
이제 다음 코드를 실행하여 그림 시 Du Fu's Ascension을 텍스트로 구문 분석합니다.
위 내용은 Python 코드는 이미지 텍스트 인식을 실현합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!