Maison développement back-end Tutoriel Python La programmation Python implémente la fonction d'accueil de l'interface Baidu OCR et d'extraction de texte d'image

La programmation Python implémente la fonction d'accueil de l'interface Baidu OCR et d'extraction de texte d'image

Aug 26, 2023 pm 05:28 PM
python编程 图片文字提取 Interface OCr Baidu

La programmation Python implémente la fonction daccueil de linterface Baidu OCR et dextraction de texte dimage

Programmation Python pour implémenter l'accueil de l'interface Baidu OCR et la fonction d'extraction de texte d'image

Introduction :
Avec le développement rapide de l'apprentissage profond, la technologie OCR (Optical Character Recognition, reconnaissance optique de caractères) est progressivement devenue une application populaire dans le domaine de la vision par ordinateur. L'interface OCR fournie par la plateforme ouverte Baidu AI offre aux développeurs des capacités de reconnaissance de texte pratiques et rapides. Cet article combinera la programmation Python pour démontrer comment s'interfacer avec l'interface Baidu OCR pour réaliser la fonction d'extraction du texte de l'image.

Étape 1 : demander un compte Baidu AI Open Platform
Tout d'abord, nous devons créer un compte sur le site officiel de Baidu AI Open Platform (https://ai.baidu.com/). Une fois l'enregistrement terminé, vous devez créer une application pour obtenir la clé API et la clé secrète.

Étape 2 : Installez la bibliothèque Python correspondante
Nous devons utiliser Python pour la programmation, veuillez vous assurer d'avoir installé les bibliothèques suivantes :

  • requests : utilisée pour envoyer des requêtes HTTP
  • base64 : utilisée pour convertir les images en encodage Base64
  • hashlib : utilisé pour générer des signatures MD5
  • time : utilisé pour générer des horodatages
  • json : utilisé pour analyser les données JSON renvoyées par l'API

Ces bibliothèques peuvent être installées via la commande suivante :

pip install requests
Copier après la connexion

Étape 3 : Implémentation de l'encodage

Ensuite, nous écrirons du code Python pour implémenter la fonction d'extraction de texte d'image. Tout d'abord, nous devons importer les bibliothèques requises :

import requests
import base64
import hashlib
import time
import json
Copier après la connexion

Ensuite, nous devons définir plusieurs variables pour stocker la clé API, la clé secrète et d'autres informations :

API_KEY = 'your_api_key'
SECRET_KEY = 'your_secret_key'
OCR_URL = 'https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic'
Copier après la connexion

Ensuite, nous devons écrire une fonction pour convertir l'image en base64. string :

def image_to_base64(image_path):
    with open(image_path, 'rb') as image_file:
        return base64.b64encode(image_file.read()).decode('utf-8')
Copier après la connexion

Ensuite, nous devons écrire une fonction pour générer les informations de signature de la requête API :

def generate_sign(url, params, timestamp, secret_key):
    sorted_params = sorted(params.items(), key=lambda x: x[0])
    sorted_params.append(('timestamp', str(timestamp)))
    raw_sign = ''.join([x[0] + '=' + x[1] for x in sorted_params]) + secret_key
    sign = hashlib.md5(raw_sign.encode('utf-8')).hexdigest()
    return url + '?' + '&'.join([x[0] + '=' + x[1] for x in sorted_params]) + '&sign=' + sign
Copier après la connexion

Enfin, nous écrivons une fonction principale pour appeler l'interface Baidu OCR pour implémenter la fonction d'extraction de texte d'image :

def ocr(image_path):
    access_token = get_access_token(API_KEY, SECRET_KEY)
    url_params = {
        'access_token': access_token,
        'image': image_to_base64(image_path)
    }
    timestamp = int(time.time())
    request_url = generate_sign(OCR_URL, url_params, timestamp, SECRET_KEY)
    response = requests.post(request_url)
    result = response.json()
    if 'words_result' in result:
        for word in result['words_result']:
            print(word['words'])
    else:
        print('Error occurred: ' + result['error_msg'])
Copier après la connexion

Étape 4 : Exécutez le code
Maintenant, nous pouvons exécuter le code pour extraire les informations textuelles de l'image :

ocr('image.jpg')
Copier après la connexion

Avant de l'exécuter, veuillez remplacer « image.jpg » par le chemin de l'image dont vous souhaitez extraire le texte.

Conclusion : 
L'amarrage de l'interface Baidu OCR est réalisé grâce à la programmation Python et la fonction d'extraction de texte d'image est réalisée. Cela permet aux développeurs d'utiliser facilement et rapidement la technologie OCR de la plateforme Baidu AI pour réaliser divers scénarios d'application de reconnaissance de texte. Qu'il s'agisse de numérisation de documents, de reconnaissance de codes de vérification ou de remplissage de formulaires, grâce à la puissance de l'OCR, nous pouvons effectuer le traitement et l'analyse de texte plus efficacement. Nous espérons que grâce à la démonstration présentée dans cet article, les lecteurs pourront avoir une compréhension plus approfondie du principe de fonctionnement de l'OCR et mettre en œuvre des applications OCR plus complexes dans des projets réels.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

AI Hentai Generator

Générez AI Hentai gratuitement.

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Techniques d'analyse résiduelle en Python Techniques d'analyse résiduelle en Python Jun 10, 2023 am 08:52 AM

Python est un langage de programmation largement utilisé, et ses puissantes capacités d'analyse et de visualisation de données en font l'un des outils préférés des data scientists et des ingénieurs en apprentissage automatique. Dans ces applications, l'analyse résiduelle est une technique courante utilisée pour évaluer la précision du modèle et identifier tout biais du modèle. Dans cet article, nous présenterons plusieurs façons d'utiliser les techniques d'analyse résiduelle en Python. Comprendre les résidus Avant d'introduire les techniques d'analyse des résidus en Python, comprenons d'abord ce que sont les résidus. En statistique, le résidu est la différence entre la valeur réelle observée et

AssertionError : Comment résoudre les erreurs d'assertion Python ? AssertionError : Comment résoudre les erreurs d'assertion Python ? Jun 25, 2023 pm 11:07 PM

Les assertions en Python sont un outil utile permettant aux programmeurs de déboguer leur code. Il est utilisé pour vérifier que l'état interne du programme répond aux attentes et générer une erreur d'assertion (AssertionError) lorsque ces conditions sont fausses. Pendant le processus de développement, des assertions sont utilisées lors des tests et du débogage pour vérifier si l'état du code correspond aux résultats attendus. Cet article abordera les causes, les solutions et comment utiliser correctement les assertions dans votre code. Cause de l'erreur d'assertion Erreur d'assertion réussie

Techniques d'échantillonnage stratifié en Python Techniques d'échantillonnage stratifié en Python Jun 10, 2023 pm 10:40 PM

Technique d'échantillonnage stratifié en Python L'échantillonnage est une méthode de collecte de données couramment utilisée en statistiques. Elle peut sélectionner une partie d'échantillons de l'ensemble de données pour analyse afin de déduire les caractéristiques de l'ensemble de données. À l’ère du Big Data, la quantité de données est énorme et l’utilisation d’échantillons complets à des fins d’analyse prend du temps et n’est pas économiquement pratique. Par conséquent, le choix d’une méthode d’échantillonnage appropriée peut améliorer l’efficacité de l’analyse des données. Cet article présente principalement les techniques d'échantillonnage stratifié en Python. Qu’est-ce que l’échantillonnage stratifié ? En échantillonnage, échantillonnage stratifié

Comment développer un scanner de vulnérabilités en Python Comment développer un scanner de vulnérabilités en Python Jul 01, 2023 am 08:10 AM

Présentation de la façon de développer un scanner de vulnérabilités via Python Dans l'environnement actuel de menaces croissantes pour la sécurité Internet, les scanners de vulnérabilités sont devenus un outil important pour protéger la sécurité du réseau. Python est un langage de programmation populaire, concis, facile à lire et puissant, adapté au développement de divers outils pratiques. Cet article explique comment utiliser Python pour développer un scanner de vulnérabilités afin de fournir une protection en temps réel à votre réseau. Étape 1 : Déterminer les cibles d'analyse Avant de développer un scanner de vulnérabilités, vous devez déterminer les cibles que vous souhaitez analyser. Il peut s'agir de votre propre réseau ou de tout ce que vous êtes autorisé à tester.

Comment utiliser Python pour les scripts et l'exécution sous Linux Comment utiliser Python pour les scripts et l'exécution sous Linux Oct 05, 2023 am 11:45 AM

Comment utiliser Python pour écrire et exécuter des scripts sous Linux Dans le système d'exploitation Linux, nous pouvons utiliser Python pour écrire et exécuter divers scripts. Python est un langage de programmation concis et puissant qui fournit une multitude de bibliothèques et d'outils pour rendre la création de scripts plus facile et plus efficace. Ci-dessous, nous présenterons les étapes de base de l'utilisation de Python pour l'écriture et l'exécution de scripts sous Linux, et fournirons quelques exemples de code spécifiques pour vous aider à mieux le comprendre et l'utiliser. Installer Python

Utilisation de la fonction sqrt() en Python Utilisation de la fonction sqrt() en Python Feb 21, 2024 pm 03:09 PM

Exemples d'utilisation et de code de la fonction sqrt() en Python 1. Fonction et introduction de la fonction sqrt() Dans la programmation Python, la fonction sqrt() est une fonction du module mathématique, et sa fonction est de calculer la racine carrée de un numéro. La racine carrée signifie qu'un nombre multiplié par lui-même est égal au carré du nombre, c'est-à-dire x*x=n, alors x est la racine carrée de n. La fonction sqrt() peut être utilisée dans le programme pour calculer la racine carrée. 2. Comment utiliser la fonction sqrt() en Python, sq

Comment reconnaître le texte d'une image sur WeChat Comment reconnaître le texte d'une image sur WeChat Mar 12, 2024 pm 02:27 PM

1. Envoyez d'abord l'image à identifier à n'importe quelle boîte de discussion, puis cliquez sur l'image pour l'agrandir. 2. Appuyez longuement sur l'image et cliquez sur [Extraire le texte] dans les options de fonction qui apparaissent pour extraire le texte de l'image.

Apprenez à utiliser la programmation Python pour réaliser l'amarrage de l'interface de reconnaissance d'image Baidu et réaliser la fonction de reconnaissance d'image. Apprenez à utiliser la programmation Python pour réaliser l'amarrage de l'interface de reconnaissance d'image Baidu et réaliser la fonction de reconnaissance d'image. Aug 25, 2023 pm 03:10 PM

Apprenez à utiliser la programmation Python pour implémenter l'amarrage de l'interface de reconnaissance d'image de Baidu et réaliser la fonction de reconnaissance d'image. Dans le domaine de la vision par ordinateur, la technologie de reconnaissance d'image est une technologie très importante. Baidu fournit une puissante interface de reconnaissance d'images grâce à laquelle nous pouvons facilement mettre en œuvre la classification, l'étiquetage, la reconnaissance faciale et d'autres fonctions d'images. Cet article vous apprendra comment utiliser le langage de programmation Python pour implémenter des fonctions de reconnaissance d'images en vous connectant à l'interface de reconnaissance d'images de Baidu. Tout d’abord, nous devons créer une application sur Baidu Developer Platform et obtenir

See all articles