Pengaturcaraan Python untuk melaksanakan perkongsian kod dok API Pengecaman Teks Baidu
Pengenalan: API Pengecaman Teks Baidu ialah alat pengecaman teks yang berkuasa yang boleh mengekstrak teks daripada imej dan menukarnya menjadi teks boleh diedit. Dalam pengaturcaraan Python, kita boleh menggunakan kod dok API pengecaman teks Baidu untuk merealisasikan fungsi pengecaman teks. Artikel ini akan berkongsi program Python mudah untuk menunjukkan cara menggunakan API Pengecaman Teks Baidu untuk pengecaman teks.
1. Persediaan
Sebelum menggunakan Baidu Text Recognition API, kami perlu mendaftar akaun Baidu Cloud dan mengaktifkan perkhidmatan API.
Buat aplikasi pengecaman teks dalam konsol Baidu Cloud dan dapatkan Kunci API dan Kunci Rahsia ini adalah kunci untuk membuat panggilan API.
Jalankan arahan berikut dalam terminal untuk memasang Python Baidu Cloud SDK:
pip install baidu-aip
2. Tulis kod
Berikut ialah program Python mudah yang menunjukkan cara menggunakan Baidu Text Recognition API untuk pengecaman teks Pengecaman:
from aip import AipOcr # 配置百度文字识别API的参数 APP_ID = '您的APP_ID' API_KEY = '您的API_KEY' SECRET_KEY = '您的SECRET_KEY' # 创建一个AipOcr对象 client = AipOcr(APP_ID, API_KEY, SECRET_KEY) # 读取图片文件 def get_file_content(file_path): with open(file_path, 'rb') as fp: return fp.read() # 调用百度文字识别API进行文字识别 def recognize_text(image_path): # 读取图片文件 image = get_file_content(image_path) # 调用百度文字识别API result = client.basicGeneral(image) # 解析识别结果 if 'words_result' in result: for word_info in result['words_result']: print(word_info['words']) # 测试代码 if __name__ == '__main__': image_path = 'test.png' # 需要识别的图片文件路径 recognize_text(image_path)
3. Analisis kod
Pada permulaan kod, kami perlu mengisi APP_ID, API_KEY dan SECRET kami sendiri disimpan dalam Baidu Cloud Console. Gantikan "APP_ID anda", "API_KEY anda" dan "SECRET_KEY anda" dalam kod di atas dengan nilai yang sepadan.
Buat objek AipOcr dengan memasukkan APP_ID, API_KEY dan SECRET_KEY untuk panggilan API berikutnya.
Tulis fungsi get_file_content
untuk membaca kandungan binari fail imej. Apabila memanggil API pengecaman teks Baidu, fail imej perlu ditukar kepada format binari. get_file_content
,用于读取图片文件的二进制内容。在调用百度文字识别API时,需要将图片文件转化为二进制格式。
编写一个函数recognize_text
,用于调用百度文字识别API进行文字识别。在函数内部,我们先读取图片文件的二进制内容,然后调用client.basicGeneral
方法,传入图片内容进行文字识别。
输出识别结果,遍历识别结果中的每个词块,将其中的文字信息打印出来。
四、测试运行
将需要识别的图片文件放在代码中指定的路径,替换变量image_path
Tulis fungsi recognize_text
untuk memanggil API pengecaman teks Baidu untuk pengecaman teks. Di dalam fungsi, kami mula-mula membaca kandungan perduaan fail imej, dan kemudian memanggil kaedah client.basicGeneral
untuk menghantar kandungan imej untuk pengecaman teks.
image_path
. Kemudian jalankan kod dan anda boleh melihat maklumat teks dalam gambar pada konsol. 🎜🎜Ringkasan: 🎜🎜Artikel ini memperkenalkan cara menggunakan pengaturcaraan Python untuk merealisasikan pengecaman teks dalam gambar melalui API Pengecaman Teks Baidu. Dengan hanya menetapkan Kunci API dan Kunci Rahsia Baidu Cloud, hantar fail imej kepada API untuk pengecaman teks, dan kemudian huraikan hasil pengecaman untuk mendapatkan kandungan teks. Menggunakan SDK Python yang disediakan oleh Baidu Cloud, pembangun boleh melaksanakan fungsi pengecaman teks dengan cepat dengan hanya beberapa baris kod. 🎜Atas ialah kandungan terperinci Pengaturcaraan Python melaksanakan perkongsian kod dok API pengecaman teks Baidu. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!