Python程式實作百度OCR介面對接，實現圖片文字擷取功能-Python教學-PHP中文網

首頁

後端開發

Python教學

Python程式實作百度OCR介面對接，實現圖片文字擷取功能

PHPz

Aug 26, 2023 pm 05:28 PM

Python直式程式設計圖片文字擷取百度ocr介面

Python程式實作百度OCR介面對接，實現圖片文字擷取功能

Python程式實現百度OCR介面對接，實作圖片文字擷取功能

引言：
隨著深度學習的快速發展，OCR（Optical Character Recognition，光學字元辨識）技術逐漸成為了電腦視覺領域的熱門應用之一。而百度AI開放平台提供的OCR接口，為開發者提供了便捷快速的文字辨識能力。本文將結合Python編程，示範如何對接百度OCR接口，實現圖片文字的擷取功能。

步驟1：申請百度AI開放平台帳號
首先，我們需要到百度AI開放平台官網（https://ai.baidu.com/）註冊一個帳號。註冊完成後，需要建立一個應用，以取得API Key和Secret Key。

步驟2：安裝對應的Python庫
我們需要使用Python進行編程，請確保已經安裝了以下幾個庫：

requests：用於發送HTTP請求
base64：用於將圖片轉換為Base64編碼
hashlib：用於產生MD5簽章
time：用於產生時間戳記

可以透過以下指令安裝這些函式庫：

pip install requests

登入後複製

步驟3：編碼實作

接下來，我們將寫Python程式碼實現圖片文字擷取功能。首先，我們需要導入所需的函式庫：

import requests
import base64
import hashlib
import time
import json

登入後複製

然後，我們需要定義幾個變數來儲存API Key、Secret Key等資訊：

API_KEY = 'your_api_key'
SECRET_KEY = 'your_secret_key'
OCR_URL = 'https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic'

登入後複製

接下來，我們需要寫一個函數，用於將圖片轉換為Base64編碼字串：

def image_to_base64(image_path):
    with open(image_path, 'rb') as image_file:
        return base64.b64encode(image_file.read()).decode('utf-8')

登入後複製

然後，我們需要編寫一個函數，用於產生API請求的簽名資訊：

def generate_sign(url, params, timestamp, secret_key):
    sorted_params = sorted(params.items(), key=lambda x: x[0])
    sorted_params.append(('timestamp', str(timestamp)))
    raw_sign = ''.join([x[0] + '=' + x[1] for x in sorted_params]) + secret_key
    sign = hashlib.md5(raw_sign.encode('utf-8')).hexdigest()
    return url + '?' + '&'.join([x[0] + '=' + x[1] for x in sorted_params]) + '&sign=' + sign

登入後複製

最後，我們編寫一個主函數來呼叫百度OCR接口，實現圖片文字的提取功能：

def ocr(image_path):
    access_token = get_access_token(API_KEY, SECRET_KEY)
    url_params = {
        'access_token': access_token,
        'image': image_to_base64(image_path)
    }
    timestamp = int(time.time())
    request_url = generate_sign(OCR_URL, url_params, timestamp, SECRET_KEY)
    response = requests.post(request_url)
    result = response.json()
    if 'words_result' in result:
        for word in result['words_result']:
            print(word['words'])
    else:
        print('Error occurred: ' + result['error_msg'])

登入後複製

步驟4：運行代碼

現在，我們可以運行代碼來提取圖片中的文字資訊了：

ocr('image.jpg')

登入後複製

在運行之前，請將'image.jpg'替換為您想要提取文字的圖片路徑。

結論：

透過Python程式實現了百度OCR介面的對接，並實現了圖片文字擷取的功能。這使得開發者能夠方便快速地利用百度AI平台的OCR技術，實現各種文字辨識的應用場景。無論是文件掃描、驗證碼辨識或表單填寫等任務，利用OCR的能力，我們可以更有效率地進行文字處理和分析。希望讀者透過本文的演示，能夠更深入地了解OCR的工作原理，並在實際專案中實現更複雜的OCR應用。

以上是Python程式實作百度OCR介面對接，實現圖片文字擷取功能的詳細內容。更多資訊請關注PHP中文網其他相關文章！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

人工智慧驅動的應用程序，用於創建逼真的裸體照片

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

免費脫衣圖片

Clothoff.io

AI脫衣器

Video Face Swap

使用我們完全免費的人工智慧換臉工具，輕鬆在任何影片中換臉！

熱工具

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

中文版，非常好用

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

gmail信箱登陸入口在哪裡

7899

Java教學

1651

CakePHP 教程

1411

Laravel 教程

1303

PHP教程

1248

Related knowledge

Python中的殘差分析技巧 Jun 10, 2023 am 08:52 AM

Python是一種廣泛使用的程式語言，其強大的資料分析和視覺化功能使其成為資料科學家和機器學習工程師的首選工具之一。在這些應用中，殘差分析是一種常見的技術，用於評估模型的準確性和識別任何模型偏差。在本文中，我們將介紹Python中使用殘差分析技巧的幾種方法。在介紹殘差在介紹Python中的殘差分析技巧之前，先讓我們先了解什麼是殘差。在統計學中，殘差是實際觀測值與

AssertionError：如何解決Python斷言錯誤？ Jun 25, 2023 pm 11:07 PM

Python中的斷言(assert)是程式設計師用來偵錯程式碼的有用工具。它用於驗證程式的內部狀態是否滿足預期，並在這些條件為假時引發一個斷言錯誤(AssertionError)。在開發過程中，測試和偵錯階段都使用斷言來檢查程式碼的狀態和預期結果是否相符。本文將討論AssertionError的原因、解決方法以及如何在程式碼中正確使用斷言。斷言錯誤的原因斷言錯誤通

Python中的分層抽樣技巧 Jun 10, 2023 pm 10:40 PM

Python中的分層抽樣技巧抽樣是統計學中常用的資料收集方法，它可以從資料集中選擇一部分樣本進行分析，以此推斷出整個資料集的特徵。在大數據時代，數據量龐大，使用全樣本進行分析既耗費時間又不夠經濟實際。因此，選擇合適的抽樣方法可以提高資料分析效率。本文主要介紹Python中的分層抽樣技巧。什麼是分層抽樣？在抽樣中，分層抽樣（stratifiedsampl

如何使用Python在Linux中進行腳本編寫和執行 Oct 05, 2023 am 11:45 AM

如何使用Python在Linux中進行腳本編寫和執行在Linux作業系統中，我們可以使用Python編寫並執行各種腳本。 Python是一種簡潔而強大的程式語言，它提供了豐富的函式庫和工具，使得腳本編寫變得更加簡單和有效率。以下我們將介紹在Linux中如何使用Python進行腳本編寫和執行的基本步驟，同時提供一些具體的程式碼範例來幫助你更好地理解和運用。安裝Pytho

Python開發漏洞掃描器的方法 Jul 01, 2023 am 08:10 AM

如何透過Python開發漏洞掃描器概述在當今網路安全威脅增加的環境下，漏洞掃描器成為了保護網路安全的重要工具。 Python是一種流行的程式語言，簡潔易讀且功能強大，適合開發各種實用工具。本文將介紹如何使用Python開發漏洞掃描器，為您的網路提供即時保護。步驟一：確定掃描目標在開發漏洞掃描器之前，您需要確定要掃描的目標。這可以是您自己的網路或任何您有權限測

Python中sqrt()函數用法 Feb 21, 2024 pm 03:09 PM

Python中sqrt()函數用法及程式碼範例一、sqrt()函數的功能及介紹在Python程式設計中，sqrt()函數是math模組中的一個函數，其功能是計算一個數的平方根。平方根是指一個數與自己相乘等於這個數的平方，即x*x=n，則x就是n的平方根。程式中可以使用sqrt()函數來實現對平方根的計算。二、sqrt()函數的使用方法在Python中，sq

Python程式實戰：利用百度地圖API產生靜態地圖功能的方法 Jul 30, 2023 pm 09:05 PM

Python程式實戰：利用百度地圖API產生靜態地圖功能的方法導語：在現代社會中，地圖已成為人們生活中不可缺少的一部分。在使用地圖時，我們常常需要取得特定區域的靜態地圖，以便在網頁、行動應用程式或報告中進行展示。本文將介紹如何利用Python程式語言和百度地圖API來產生靜態地圖，並提供相關的程式碼範例。一、準備工作要實現利用百度地圖API產生靜態地圖的功能，我

Python程式設計解析百度地圖API文件中的座標轉換功能 Aug 01, 2023 am 08:57 AM

Python程式解析百度地圖API文件中的座標轉換功能導讀：隨著網路的快速發展，地圖定位功能已成為現代人生活中不可或缺的一部分。而百度地圖作為國內最受歡迎的地圖服務之一，提供了一系列的API供開發者使用。本文將透過Python編程，解析百度地圖API文件中的座標轉換功能，並給出對應的程式碼範例。一、引言在開發中，我們有時會涉及到座標的轉換問題。百度地圖AP

See all articles

Python程式實作百度OCR介面對接，實現圖片文字擷取功能

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

熱門文章

熱工具

記事本++7.3.1

SublimeText3漢化版

禪工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

熱門話題