Python程式實作百度OCR介面對接,實現圖片文字擷取功能
Python程式實現百度OCR介面對接,實作圖片文字擷取功能
引言:
隨著深度學習的快速發展,OCR(Optical Character Recognition,光學字元辨識)技術逐漸成為了電腦視覺領域的熱門應用之一。而百度AI開放平台提供的OCR接口,為開發者提供了便捷快速的文字辨識能力。本文將結合Python編程,示範如何對接百度OCR接口,實現圖片文字的擷取功能。
步驟1:申請百度AI開放平台帳號
首先,我們需要到百度AI開放平台官網(https://ai.baidu.com/)註冊一個帳號。註冊完成後,需要建立一個應用,以取得API Key和Secret Key。
步驟2:安裝對應的Python庫
我們需要使用Python進行編程,請確保已經安裝了以下幾個庫:
- requests:用於發送HTTP請求
- base64:用於將圖片轉換為Base64編碼
- hashlib:用於產生MD5簽章
- time:用於產生時間戳記 ##json:用於解析API傳回的JSON資料
pip install requests
import requests import base64 import hashlib import time import json
API_KEY = 'your_api_key' SECRET_KEY = 'your_secret_key' OCR_URL = 'https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic'
def image_to_base64(image_path): with open(image_path, 'rb') as image_file: return base64.b64encode(image_file.read()).decode('utf-8')
def generate_sign(url, params, timestamp, secret_key): sorted_params = sorted(params.items(), key=lambda x: x[0]) sorted_params.append(('timestamp', str(timestamp))) raw_sign = ''.join([x[0] + '=' + x[1] for x in sorted_params]) + secret_key sign = hashlib.md5(raw_sign.encode('utf-8')).hexdigest() return url + '?' + '&'.join([x[0] + '=' + x[1] for x in sorted_params]) + '&sign=' + sign
def ocr(image_path): access_token = get_access_token(API_KEY, SECRET_KEY) url_params = { 'access_token': access_token, 'image': image_to_base64(image_path) } timestamp = int(time.time()) request_url = generate_sign(OCR_URL, url_params, timestamp, SECRET_KEY) response = requests.post(request_url) result = response.json() if 'words_result' in result: for word in result['words_result']: print(word['words']) else: print('Error occurred: ' + result['error_msg'])
現在,我們可以運行代碼來提取圖片中的文字資訊了:
ocr('image.jpg')
透過Python程式實現了百度OCR介面的對接,並實現了圖片文字擷取的功能。這使得開發者能夠方便快速地利用百度AI平台的OCR技術,實現各種文字辨識的應用場景。無論是文件掃描、驗證碼辨識或表單填寫等任務,利用OCR的能力,我們可以更有效率地進行文字處理和分析。希望讀者透過本文的演示,能夠更深入地了解OCR的工作原理,並在實際專案中實現更複雜的OCR應用。
以上是Python程式實作百度OCR介面對接,實現圖片文字擷取功能的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

Python是一種廣泛使用的程式語言,其強大的資料分析和視覺化功能使其成為資料科學家和機器學習工程師的首選工具之一。在這些應用中,殘差分析是一種常見的技術,用於評估模型的準確性和識別任何模型偏差。在本文中,我們將介紹Python中使用殘差分析技巧的幾種方法。在介紹殘差在介紹Python中的殘差分析技巧之前,先讓我們先了解什麼是殘差。在統計學中,殘差是實際觀測值與

Python中的斷言(assert)是程式設計師用來偵錯程式碼的有用工具。它用於驗證程式的內部狀態是否滿足預期,並在這些條件為假時引發一個斷言錯誤(AssertionError)。在開發過程中,測試和偵錯階段都使用斷言來檢查程式碼的狀態和預期結果是否相符。本文將討論AssertionError的原因、解決方法以及如何在程式碼中正確使用斷言。斷言錯誤的原因斷言錯誤通

Python中的分層抽樣技巧抽樣是統計學中常用的資料收集方法,它可以從資料集中選擇一部分樣本進行分析,以此推斷出整個資料集的特徵。在大數據時代,數據量龐大,使用全樣本進行分析既耗費時間又不夠經濟實際。因此,選擇合適的抽樣方法可以提高資料分析效率。本文主要介紹Python中的分層抽樣技巧。什麼是分層抽樣?在抽樣中,分層抽樣(stratifiedsampl

如何使用Python在Linux中進行腳本編寫和執行在Linux作業系統中,我們可以使用Python編寫並執行各種腳本。 Python是一種簡潔而強大的程式語言,它提供了豐富的函式庫和工具,使得腳本編寫變得更加簡單和有效率。以下我們將介紹在Linux中如何使用Python進行腳本編寫和執行的基本步驟,同時提供一些具體的程式碼範例來幫助你更好地理解和運用。安裝Pytho

如何透過Python開發漏洞掃描器概述在當今網路安全威脅增加的環境下,漏洞掃描器成為了保護網路安全的重要工具。 Python是一種流行的程式語言,簡潔易讀且功能強大,適合開發各種實用工具。本文將介紹如何使用Python開發漏洞掃描器,為您的網路提供即時保護。步驟一:確定掃描目標在開發漏洞掃描器之前,您需要確定要掃描的目標。這可以是您自己的網路或任何您有權限測

Python中sqrt()函數用法及程式碼範例一、sqrt()函數的功能及介紹在Python程式設計中,sqrt()函數是math模組中的一個函數,其功能是計算一個數的平方根。平方根是指一個數與自己相乘等於這個數的平方,即x*x=n,則x就是n的平方根。程式中可以使用sqrt()函數來實現對平方根的計算。二、sqrt()函數的使用方法在Python中,sq

Python程式實戰:利用百度地圖API產生靜態地圖功能的方法導語:在現代社會中,地圖已成為人們生活中不可缺少的一部分。在使用地圖時,我們常常需要取得特定區域的靜態地圖,以便在網頁、行動應用程式或報告中進行展示。本文將介紹如何利用Python程式語言和百度地圖API來產生靜態地圖,並提供相關的程式碼範例。一、準備工作要實現利用百度地圖API產生靜態地圖的功能,我

Python程式解析百度地圖API文件中的座標轉換功能導讀:隨著網路的快速發展,地圖定位功能已成為現代人生活中不可或缺的一部分。而百度地圖作為國內最受歡迎的地圖服務之一,提供了一系列的API供開發者使用。本文將透過Python編程,解析百度地圖API文件中的座標轉換功能,並給出對應的程式碼範例。一、引言在開發中,我們有時會涉及到座標的轉換問題。百度地圖AP
