최근 생각해보니 이미지 텍스트 인식 도구가 없나요? 중국에서 비교적 강력한 한왕OCR인 OCR이 생각났습니다. 그렇다면 파이썬의 도움으로 이를 달성할 수 있을까요? 그래서 이 분야에 대한 PYthon의 논의에 대한 정보를 검색하고 검색하다가 PyTesser라는 재미있는 프로그램을 발견했습니다! 꺼내서 토론을 위해 공유하세요.
PyTesser는 Python용 광학 문자 인식 모듈입니다. Tesseract OCR 엔진과 함께 사용되어 그림이나 이미지 파일에서 문자열을 추출하고 출력합니다.
PyTesser를 사용하려면 Tesseract OCR 엔진을 설치할 필요는 없지만 먼저 PIL 모듈(Python Image Library, Python 그래픽 라이브러리)을 설치해야 합니다.
공식 소개:
PyTesser는 Python용 광학 문자 인식 모듈입니다. 이미지 또는 이미지 파일을 입력으로 받아 문자열을 출력합니다.
PyTesser는 Tesseract OCR 엔진을 사용하여 이미지를 허용되는 형식으로 변환하고 Tesseract를 호출합니다. 외부 스크립트로 실행 가능합니다. Windows 실행 파일은 Python 스크립트와 함께 제공됩니다. 스크립트는 다른 운영 체제에서도 작동합니다.
PyTesser 공식 다운로드 주소: http://code.google.com/p /pytesser/ downloads/list
PIL 라이브러리 리소스 주소: http://www.pythonware.com/products/pil/
그러나 테스트 과정에서 영어만 지원되는 것으로 확인되었습니다. 콘텐츠 인식이 더 이상적이지만 중국어를 처리하고 인식할 수 없습니다!
관심 있는 학생은 체험해 보세요