Ajar anda menggunakan pengaturcaraan Python untuk melaksanakan dok antara muka OCR Baidu dan mengekstrak teks daripada gambar-Tutorial Python-php.cn

Ajar anda menggunakan pengaturcaraan Python untuk melaksanakan dok antara muka OCR Baidu dan mengekstrak teks daripada gambar

PHPz

Lepaskan： 2023-08-14 17:13:06

asal

1849 orang telah melayarinya

Ajar anda menggunakan pengaturcaraan Python untuk melaksanakan dok antara muka OCR Baidu dan mengekstrak teks daripada gambar

Ajar anda cara menggunakan pengaturcaraan Python untuk melaksanakan dok antara muka OCR Baidu dan mengekstrak teks daripada gambar

Kata Pengantar:

Dengan perkembangan teknologi yang berterusan, aplikasi kecerdasan buatan menjadi semakin meluas. Antaranya, aplikasi teknologi pengecaman teks (OCR) amat penting, yang boleh membantu kami mengekstrak teks daripada imej dan mencapai pemprosesan automatik. Antara muka OCR Baidu ialah teknologi pengecaman teks yang sangat popular pada masa ini Artikel ini akan mengajar anda cara menggunakan pengaturcaraan Python untuk menyambung ke antara muka OCR Baidu untuk mengekstrak teks daripada gambar.

Buat akaun Baidu OCR

Pertama, anda perlu mencipta akaun Baidu OCR. Lawati Pusat Pembangun Baidu (https://cloud.baidu.com/), daftar akaun dan buat aplikasi baharu.

Pasang Baidu OCR Python SDK

Seterusnya, kami perlu memasang Baidu OCR Python SDK, yang merangkumi logik interaksi dengan antara muka Baidu OCR untuk memudahkan operasi pengecaman teks kami.

Buka terminal atau command prompt dan laksanakan arahan berikut untuk memasang SDK:

pip install baidu-aip

Salin selepas log masuk

Import perpustakaan yang diperlukan dan tetapkan Kunci API

Dalam fail Python anda, import perpustakaan yang diperlukan dan tetapkan Kunci API. Kunci API ialah kunci yang dimiliki oleh aplikasi yang anda buat dalam akaun Baidu OCR anda, yang digunakan untuk mengesahkan identiti anda. Contoh kod adalah seperti berikut:

from aip import AipOcr

# 设置APPID/AK/SK
APP_ID = 'your_app_id'
API_KEY = 'your_api_key'
SECRET_KEY = 'your_secret_key'

# 创建AipOcr对象
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)

Salin selepas log masuk

Ganti your_app_id, your_api_key, your_secret_key dalam kod di atas dengan nama aplikasi yang anda buat dalam Baidu anda Akaun OCR Kunci API yang sepadan. your_app_id、your_api_key、your_secret_key替换成你在百度OCR账号中创建的应用所对应的API Key。

读取图片和调用接口

接下来，我们需要读取待识别的图片，并调用百度OCR接口，将图片中的文字提取出来。

def get_file_content(filePath):
    with open(filePath, 'rb') as fp:
        return fp.read()

# 读取图片
image = get_file_content('your_image_path')

# 调用文字识别接口
result = client.basicGeneral(image)

# 提取文字
words = []
for item in result['words_result']:
    words.append(item['words'])

# 打印文字
for word in words:
    print(word)

Salin selepas log masuk

将上述代码中的your_image_path

Seterusnya, kita perlu membaca imej untuk dikenali dan memanggil antara muka Baidu OCR untuk mengekstrak teks dalam imej.

Gantikan laluan_imej_anda dalam kod di atas dengan laluan imej yang ingin anda kenal pasti.

Selepas melengkapkan langkah di atas, anda boleh menjalankan fail Python dan mengujinya untuk melihat teks yang diekstrak daripada imej.

Ringkasan:

Atas ialah kandungan terperinci Ajar anda menggunakan pengaturcaraan Python untuk melaksanakan dok antara muka OCR Baidu dan mengekstrak teks daripada gambar. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!