Baidu Text Recognition API 도킹 코드 공유를 구현하는 Python 프로그래밍
소개: Baidu Text Recognition API는 이미지에서 텍스트를 추출하여 편집 가능한 텍스트로 변환할 수 있는 강력한 텍스트 인식 도구입니다. Python 프로그래밍에서는 Baidu 텍스트 인식 API 도킹 코드를 사용하여 텍스트 인식 기능을 실현할 수 있습니다. 이 기사에서는 텍스트 인식을 위해 Baidu Text Recognition API를 사용하는 방법을 보여주기 위해 간단한 Python 프로그램을 공유합니다.
1. 준비
바이두 문자 인식 API를 사용하기 전에 바이두 클라우드 계정을 등록하고 API 서비스를 활성화해야 합니다.
Baidu Cloud 콘솔에서 텍스트 인식 애플리케이션을 만들고 API 키와 비밀 키를 얻습니다. 이 두 매개변수는 API 호출의 핵심입니다.
Python Baidu Cloud SDK를 설치하려면 터미널에서 다음 명령을 실행하세요.
pip install baidu-aip
2. 코드 작성
다음은 Baidu 텍스트 인식 사용 방법을 보여주는 간단한 Python 프로그램입니다. 텍스트 인식용 API:
from aip import AipOcr # 配置百度文字识别API的参数 APP_ID = '您的APP_ID' API_KEY = '您的API_KEY' SECRET_KEY = '您的SECRET_KEY' # 创建一个AipOcr对象 client = AipOcr(APP_ID, API_KEY, SECRET_KEY) # 读取图片文件 def get_file_content(file_path): with open(file_path, 'rb') as fp: return fp.read() # 调用百度文字识别API进行文字识别 def recognize_text(image_path): # 读取图片文件 image = get_file_content(image_path) # 调用百度文字识别API result = client.basicGeneral(image) # 解析识别结果 if 'words_result' in result: for word_info in result['words_result']: print(word_info['words']) # 测试代码 if __name__ == '__main__': image_path = 'test.png' # 需要识别的图片文件路径 recognize_text(image_path)
3. 코드 분석
코드 시작 부분에 자체 APP_ID, API_KEY 및 SECRET_KEY를 입력해야 합니다. Baidu Cloud Console에 저장됩니다. 위 코드의 "your APP_ID", "your API_KEY" 및 "your SECRET_KEY"를 해당 값으로 바꿉니다.
이후 API 호출에 대해 APP_ID, API_KEY 및 SECRET_KEY를 전달하여 AipOcr 개체를 만듭니다.
이미지 파일의 바이너리 콘텐츠를 읽으려면 get_file_content
함수를 작성하세요. Baidu 텍스트 인식 API를 호출할 때 이미지 파일을 바이너리 형식으로 변환해야 합니다. get_file_content
,用于读取图片文件的二进制内容。在调用百度文字识别API时,需要将图片文件转化为二进制格式。
编写一个函数recognize_text
,用于调用百度文字识别API进行文字识别。在函数内部,我们先读取图片文件的二进制内容,然后调用client.basicGeneral
方法,传入图片内容进行文字识别。
输出识别结果,遍历识别结果中的每个词块,将其中的文字信息打印出来。
四、测试运行
将需要识别的图片文件放在代码中指定的路径,替换变量image_path
텍스트 인식을 위해 Baidu 텍스트 인식 API를 호출하려면 recognize_text
함수를 작성하세요. 함수 내에서 먼저 이미지 파일의 바이너리 콘텐츠를 읽은 다음 client.basicGeneral
메서드를 호출하여 텍스트 인식을 위해 이미지 콘텐츠를 전달합니다.
image_path
변수의 값을 바꿉니다. 그런 다음 코드를 실행하면 콘솔의 그림에서 텍스트 정보를 볼 수 있습니다. 🎜🎜요약: 🎜🎜이 글에서는 Python 프로그래밍을 사용하여 Baidu Text Recognition API를 통해 사진 속 텍스트 인식을 구현하는 방법을 소개합니다. Baidu Cloud의 API Key와 Secret Key를 간단히 설정하면 텍스트 인식을 위해 이미지 파일을 API에 전달한 후 인식 결과를 구문 분석하여 텍스트 콘텐츠를 얻을 수 있습니다. Baidu Cloud에서 제공하는 Python SDK를 사용하면 개발자는 단 몇 줄의 코드만으로 텍스트 인식 기능을 빠르게 구현할 수 있습니다. 🎜위 내용은 Python 프로그래밍은 Baidu 텍스트 인식 API 도킹 코드 공유를 구현합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!