Apprenez à utiliser la programmation Python pour implémenter l'ancrage de l'interface Baidu OCR et extraire le texte des images-Tutoriel Python-php.cn

Apprenez à utiliser la programmation Python pour implémenter l'ancrage de l'interface Baidu OCR et extraire le texte des images

PHPz

Libérer： 2023-08-14 17:13:06

original

1850 Les gens l'ont consulté

Apprenez à utiliser la programmation Python pour implémenter lancrage de linterface Baidu OCR et extraire le texte des images

Vous apprendre à utiliser la programmation Python pour implémenter l'amarrage de l'interface Baidu OCR et extraire le texte des images

Avant-propos :

Avec le développement continu de la technologie, l'application de l'intelligence artificielle devient de plus en plus répandue. Parmi elles, l'application de la technologie de reconnaissance de texte (OCR) est particulièrement importante, car elle peut nous aider à extraire le texte des images et à réaliser un traitement automatisé. L'interface Baidu OCR est actuellement une technologie de reconnaissance de texte très populaire. Cet article vous apprendra comment utiliser la programmation Python pour vous connecter à l'interface Baidu OCR afin d'extraire le texte des images.

Créer un compte Baidu OCR

Tout d'abord, vous devez créer un compte Baidu OCR. Visitez le Baidu Developer Center (https://cloud.baidu.com/), créez un compte et créez une nouvelle application.

Installez le SDK Baidu OCR Python

Ensuite, nous devons installer le SDK Baidu OCR Python, qui encapsule la logique d'interaction avec l'interface Baidu OCR pour faciliter nos opérations de reconnaissance de texte.

Ouvrez un terminal ou une invite de commande et exécutez la commande suivante pour installer le SDK :

pip install baidu-aip

Copier après la connexion

Importez les bibliothèques nécessaires et définissez la clé API

Dans votre fichier Python, importez les bibliothèques nécessaires et définissez la clé API. La clé API est la clé appartenant à l'application que vous créez dans votre compte Baidu OCR, qui est utilisée pour authentifier votre identité. L'exemple de code est le suivant :

from aip import AipOcr

# 设置APPID/AK/SK
APP_ID = 'your_app_id'
API_KEY = 'your_api_key'
SECRET_KEY = 'your_secret_key'

# 创建AipOcr对象
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)

Copier après la connexion

Remplacez your_app_id, your_api_key, your_secret_key dans le code ci-dessus par le nom de l'application que vous avez créé dans votre Baidu. Compte OCR La clé API correspondante. your_app_id、your_api_key、your_secret_key替换成你在百度OCR账号中创建的应用所对应的API Key。

读取图片和调用接口

接下来，我们需要读取待识别的图片，并调用百度OCR接口，将图片中的文字提取出来。

def get_file_content(filePath):
    with open(filePath, 'rb') as fp:
        return fp.read()

# 读取图片
image = get_file_content('your_image_path')

# 调用文字识别接口
result = client.basicGeneral(image)

# 提取文字
words = []
for item in result['words_result']:
    words.append(item['words'])

# 打印文字
for word in words:
    print(word)

Copier après la connexion

将上述代码中的your_image_path