Rumah pembangunan bahagian belakang Tutorial Python Pengaturcaraan Python melaksanakan dok antara muka Baidu OCR dan fungsi pengekstrakan teks imej

Pengaturcaraan Python melaksanakan dok antara muka Baidu OCR dan fungsi pengekstrakan teks imej

Aug 26, 2023 pm 05:28 PM
pengaturcaraan python Pengekstrakan teks imej Antara muka Baidu ocr

Pengaturcaraan Python melaksanakan dok antara muka Baidu OCR dan fungsi pengekstrakan teks imej

Pengaturcaraan Python untuk melaksanakan dok antara muka OCR Baidu dan fungsi pengekstrakan teks imej

Pengenalan:
Dengan perkembangan pesat pembelajaran mendalam, teknologi OCR (Optical Character Recognition, optical character recognition) secara beransur-ansur menjadi aplikasi popular dalam bidang penglihatan komputer satu. Antara muka OCR yang disediakan oleh platform terbuka Baidu AI menyediakan pembangun dengan keupayaan pengecaman teks yang mudah dan pantas. Artikel ini akan menggabungkan pengaturcaraan Python untuk menunjukkan cara antara muka dengan antara muka OCR Baidu untuk merealisasikan fungsi pengekstrakan teks imej.

Langkah 1: Mohon akaun Baidu AI Open Platform
Pertama, kita perlu mendaftar akaun di laman web rasmi Baidu AI Open Platform (https://ai.baidu.com/). Selepas pendaftaran selesai, anda perlu membuat aplikasi untuk mendapatkan Kunci API dan Kunci Rahsia.

Langkah 2: Pasang perpustakaan Python yang sepadan
Kami perlu menggunakan Python untuk pengaturcaraan, sila pastikan anda telah memasang perpustakaan berikut:

  • permintaan: digunakan untuk menghantar permintaan HTTP
  • base64: digunakan untuk menukar imej kepada pengekodan Base64
  • hashlib: digunakan untuk menjana tandatangan MD5
  • masa: digunakan untuk menjana cap masa
  • json: digunakan untuk menghuraikan data JSON yang dikembalikan oleh API

Pustaka ini boleh dipasang melalui arahan berikut:

rrstepee Pelaksanaan Pengekodan

Seterusnya, kami akan menulis kod Python untuk melaksanakan fungsi pengekstrakan teks imej. Pertama, kita perlu mengimport perpustakaan yang diperlukan:

pip install requests
Salin selepas log masuk

Kemudian, kita perlu menentukan beberapa pembolehubah untuk menyimpan Kunci API, Kunci Rahsia dan maklumat lain:

import requests
import base64
import hashlib
import time
import json
Salin selepas log masuk

Seterusnya, kita perlu menulis fungsi untuk menukar imej kepada Base64 Encoded rentetan:

API_KEY = 'your_api_key'
SECRET_KEY = 'your_secret_key'
OCR_URL = 'https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic'
Salin selepas log masuk

Kemudian, kita perlu menulis fungsi untuk menjana maklumat tandatangan permintaan API:

def image_to_base64(image_path):
    with open(image_path, 'rb') as image_file:
        return base64.b64encode(image_file.read()).decode('utf-8')
Salin selepas log masuk

Akhir sekali, kami menulis fungsi utama untuk memanggil antara muka Baidu OCR untuk melaksanakan fungsi pengekstrakan teks imej:

def generate_sign(url, params, timestamp, secret_key):
    sorted_params = sorted(params.items(), key=lambda x: x[0])
    sorted_params.append(('timestamp', str(timestamp)))
    raw_sign = ''.join([x[0] + '=' + x[1] for x in sorted_params]) + secret_key
    sign = hashlib.md5(raw_sign.encode('utf-8')).hexdigest()
    return url + '?' + '&'.join([x[0] + '=' + x[1] for x in sorted_params]) + '&sign=' + sign
Salin selepas log masuk

Langkah 4: Jalankan kod

Sekarang, kita boleh menjalankan kod untuk mengekstrak maklumat teks daripada imej:

def ocr(image_path):
    access_token = get_access_token(API_KEY, SECRET_KEY)
    url_params = {
        'access_token': access_token,
        'image': image_to_base64(image_path)
    }
    timestamp = int(time.time())
    request_url = generate_sign(OCR_URL, url_params, timestamp, SECRET_KEY)
    response = requests.post(request_url)
    result = response.json()
    if 'words_result' in result:
        for word in result['words_result']:
            print(word['words'])
    else:
        print('Error occurred: ' + result['error_msg'])
Salin selepas log masuk

Sebelum menjalankan, sila gantikan 'image.jpg' dengan laluan imej yang anda ingin ekstrak teks.

Kesimpulan:

Docking antara muka OCR Baidu direalisasikan melalui pengaturcaraan Python, dan fungsi pengekstrakan teks imej direalisasikan. Ini membolehkan pembangun menggunakan teknologi OCR platform AI Baidu dengan mudah dan cepat untuk merealisasikan pelbagai senario aplikasi pengecaman teks. Sama ada pengimbasan dokumen, pengecaman kod pengesahan atau pengisian borang, menggunakan kuasa OCR, kami boleh melaksanakan pemprosesan perkataan dan analisis dengan lebih cekap. Kami berharap melalui demonstrasi dalam artikel ini, pembaca boleh mempunyai pemahaman yang lebih mendalam tentang prinsip kerja OCR dan melaksanakan aplikasi OCR yang lebih kompleks dalam projek sebenar.

Atas ialah kandungan terperinci Pengaturcaraan Python melaksanakan dok antara muka Baidu OCR dan fungsi pengekstrakan teks imej. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Teknik analisis sisa dalam Python Teknik analisis sisa dalam Python Jun 10, 2023 am 08:52 AM

Python ialah bahasa pengaturcaraan yang digunakan secara meluas, dan keupayaan analisis data dan visualisasi yang berkuasa menjadikannya salah satu alat pilihan untuk saintis data dan jurutera pembelajaran mesin. Dalam aplikasi ini, analisis sisa ialah teknik biasa yang digunakan untuk menilai ketepatan model dan mengenal pasti sebarang bias model. Dalam artikel ini, kami akan memperkenalkan beberapa cara untuk menggunakan teknik analisis sisa dalam Python. Memahami Sisa Sebelum memperkenalkan teknik analisis sisa dalam Python, mari kita fahami dahulu apa itu sisa. Dalam statistik, baki ialah perbezaan antara nilai cerapan sebenar dan

AssertionError: Bagaimana untuk menyelesaikan ralat pernyataan Python? AssertionError: Bagaimana untuk menyelesaikan ralat pernyataan Python? Jun 25, 2023 pm 11:07 PM

Penegasan dalam Python ialah alat yang berguna untuk pengaturcara untuk menyahpepijat kod mereka. Ia digunakan untuk mengesahkan bahawa keadaan dalaman program memenuhi jangkaan dan menimbulkan ralat penegasan (AssertionError) apabila syarat ini palsu. Semasa proses pembangunan, penegasan digunakan semasa ujian dan penyahpepijatan untuk menyemak sama ada status kod sepadan dengan hasil yang dijangkakan. Artikel ini akan membincangkan punca, penyelesaian dan cara menggunakan penegasan dengan betul dalam kod anda. Punca ralat penegasan Pas ralat penegasan

Teknik persampelan berstrata dalam Python Teknik persampelan berstrata dalam Python Jun 10, 2023 pm 10:40 PM

Teknik Persampelan Berstrata dalam Persampelan Python ialah kaedah pengumpulan data yang biasa digunakan dalam statistik Ia boleh memilih sebahagian daripada sampel daripada set data untuk dianalisis untuk membuat kesimpulan ciri-ciri keseluruhan set data. Dalam era data besar, jumlah data adalah besar, dan menggunakan keseluruhan sampel untuk analisis adalah memakan masa dan tidak praktikal dari segi ekonomi. Oleh itu, pemilihan kaedah persampelan yang sesuai dapat meningkatkan kecekapan analisis data. Artikel ini terutamanya memperkenalkan teknik persampelan berstrata dalam Python. Apakah persampelan berstrata? Dalam persampelan, persampelan berstrata

Bagaimana untuk membangunkan pengimbas kerentanan dalam Python Bagaimana untuk membangunkan pengimbas kerentanan dalam Python Jul 01, 2023 am 08:10 AM

Gambaran keseluruhan cara membangunkan pengimbas kerentanan melalui Python Dalam persekitaran hari ini yang meningkatkan ancaman keselamatan Internet, pengimbas kerentanan telah menjadi alat penting untuk melindungi keselamatan rangkaian. Python ialah bahasa pengaturcaraan popular yang ringkas, mudah dibaca dan berkuasa, sesuai untuk membangunkan pelbagai alat praktikal. Artikel ini akan memperkenalkan cara menggunakan Python untuk membangunkan pengimbas kerentanan untuk menyediakan perlindungan masa nyata untuk rangkaian anda. Langkah 1: Tentukan Sasaran Imbasan Sebelum membangunkan pengimbas kerentanan, anda perlu menentukan sasaran yang ingin anda imbas. Ini boleh menjadi rangkaian anda sendiri atau apa sahaja yang anda mempunyai kebenaran untuk menguji

Cara menggunakan Python untuk skrip dan pelaksanaan di Linux Cara menggunakan Python untuk skrip dan pelaksanaan di Linux Oct 05, 2023 am 11:45 AM

Cara menggunakan Python untuk menulis dan melaksanakan skrip dalam Linux Dalam sistem pengendalian Linux, kita boleh menggunakan Python untuk menulis dan melaksanakan pelbagai skrip. Python ialah bahasa pengaturcaraan ringkas dan berkuasa yang menyediakan banyak perpustakaan dan alatan untuk menjadikan skrip lebih mudah dan lebih cekap. Di bawah ini kami akan memperkenalkan langkah asas cara menggunakan Python untuk penulisan dan pelaksanaan skrip dalam Linux, dan menyediakan beberapa contoh kod khusus untuk membantu anda memahami dan menggunakannya dengan lebih baik. Pasang Python

Penggunaan fungsi sqrt() dalam Python Penggunaan fungsi sqrt() dalam Python Feb 21, 2024 pm 03:09 PM

Contoh penggunaan dan kod fungsi sqrt() dalam Python 1. Fungsi dan pengenalan fungsi sqrt() Dalam pengaturcaraan Python, fungsi sqrt() ialah fungsi dalam modul matematik, dan fungsinya adalah untuk mengira punca kuasa dua bagi nombor. Punca kuasa dua bermaksud nombor yang didarab dengan sendirinya sama dengan kuasa dua nombor itu, iaitu, x*x=n, maka x ialah punca kuasa dua bagi n. Fungsi sqrt() boleh digunakan dalam atur cara untuk mengira punca kuasa dua. 2. Cara menggunakan fungsi sqrt() dalam Python, sq

Bagaimana untuk mengenali teks gambar pada WeChat Bagaimana untuk mengenali teks gambar pada WeChat Mar 12, 2024 pm 02:27 PM

1. Mula-mula hantar gambar untuk dikenal pasti ke mana-mana kotak sembang, dan kemudian klik pada gambar untuk membesarkannya. 2. Tekan lama pada gambar dan klik [Ekstrak Teks] dalam pilihan fungsi yang muncul untuk mengekstrak teks daripada gambar.

Ajar anda cara menggunakan pengaturcaraan Python untuk merealisasikan dok antara muka pengecaman imej Baidu dan merealisasikan fungsi pengecaman imej. Ajar anda cara menggunakan pengaturcaraan Python untuk merealisasikan dok antara muka pengecaman imej Baidu dan merealisasikan fungsi pengecaman imej. Aug 25, 2023 pm 03:10 PM

Ajar anda menggunakan pengaturcaraan Python untuk melaksanakan dok antara muka pengecaman imej Baidu dan merealisasikan fungsi pengecaman imej Dalam bidang penglihatan komputer, teknologi pengecaman imej adalah teknologi yang sangat penting. Baidu menyediakan antara muka pengecaman imej yang berkuasa yang melaluinya kami boleh melaksanakan pengelasan imej, pelabelan, pengecaman muka dan fungsi lain dengan mudah. Artikel ini akan mengajar anda cara menggunakan bahasa pengaturcaraan Python untuk melaksanakan fungsi pengecaman imej dengan menyambung ke antara muka pengecaman imej Baidu. Pertama, kita perlu membuat aplikasi pada Platform Pembangun Baidu dan mendapatkan

See all articles