Apprenez à utiliser Python pour vous connecter à l'interface Huawei Cloud afin de mettre en œuvre la fonction de transcription audio
Dans la société moderne, l'application généralisée de la technologie de reconnaissance vocale est devenue une tendance dans divers domaines. Les utilisateurs ont souvent besoin de convertir des fichiers audio en texte pour une analyse et un traitement plus approfondis. Huawei Cloud fournit un puissant service de transcription audio. Cet article vous apprendra comment utiliser Python pour vous connecter à l'interface Huawei Cloud afin d'implémenter la fonction de transcription audio.
Étape 1 : Enregistrez un compte Huawei Cloud et créez un projet
Tout d'abord, vous devez enregistrer un compte Huawei Cloud et créer un nouveau projet. Connectez-vous à la console Huawei Cloud, créez une nouvelle clé d'accès et notez l'ID de la clé d'accès et le secret de la clé d'accès, qui seront utilisés dans les étapes suivantes.
Étape 2 : Installez les bibliothèques Python nécessaires
Avant de vous connecter à l'interface Huawei Cloud, vous devez installer localement la bibliothèque HTTP Python et le SDK Alibaba Cloud. Ouvrez une fenêtre de terminal ou de ligne de commande et exécutez la commande suivante pour installer les bibliothèques requises :
pip install requests pip install huaweicloud-sdk-core pip install huaweicloud-sdk-asr
Étape 3 : Écrivez le code de transcodage
Ensuite, écrivez le code en Python, connectez-vous à l'interface Huawei Cloud et utilisez le transcodage audio service fourni par celui-ci. Tout d'abord, importez les bibliothèques nécessaires :
import requests from huaweicloudSdkcore.auth.credentials import GlobalCredentials from huaweicloudSdkcore.region.region import Region from huaweicloudSdkasr.v1 import asrClient from huaweicloudSdkasr.v1.region.region import Region from huaweicloudSdkcore.exceptions import exceptions
Ensuite, définissez certains paramètres requis pour l'interface Huawei Cloud, notamment l'ID de clé d'accès et le secret de clé d'accès que vous avez enregistrés à la première étape, le chemin du fichier audio et le format audio :
ak = "your_access_key_id" sk = "your_access_key_secret" project_id = "your_project_id" region = "cn-north-1" audio_file = "/path/to/your/audio/file.wav"
Ensuite, créez un client d'interface Huawei Cloud :
credentials = GlobalCredentials.get_credentials(ak, sk) asr_client = asrClient.AsrClient.new_builder() .with_http_config(http_proxy=None, https_proxy=None, no_proxy=None) .with_credentials(credentials) .with_default_headers({"x-language": "zh-cn"}) .with_region(Region(region)) .build()
Ensuite, lisez les données binaires du fichier audio et convertissez-le en encodage Base64 :
with open(audio_file, mode='rb') as file: audio_data = file.read() audio_base64 = base64.b64encode(audio_data).decode()
Enfin, appelez l'interface Huawei Cloud et transmettez les données audio à l'interface pour la conversion. Écrivez et obtenez les résultats de la transcription :
request_body = { "data": audio_base64, "encode_type": "wav", "sample_rate": 16000 } response = asr_client.create_task(request_body=request_body, project_id=project_id).result task_id = response.body["result"]["task_id"] while response.body["status"] != "done": response = asr_client.get_task_result(task_id=task_id, project_id=project_id).result time.sleep(1) result = response.body["result"]["result"]
À ce stade, vous avez terminé avec succès la fonction de transcription audio. Imprimez le résultat de la transcription ou enregistrez-le sous forme de fichier texte :
print(result) with open("/path/to/your/output/file.txt", mode='w', encoding='utf-8') as file: file.write(result)
Ce qui précède est un exemple de code complet d'utilisation de Python pour se connecter à l'interface Huawei Cloud afin d'implémenter la fonction de transcription audio.
Résumé :
Grâce à l'introduction et aux exemples de code de cet article, vous avez appris à utiliser Python pour vous connecter à l'interface Huawei Cloud et implémenter la fonction de transcodage de fichiers audio. La transcription audio a des applications importantes dans de nombreux scénarios, tels que la reconnaissance vocale, la traduction vocale, etc. L'utilisation du service de transcription audio efficace et précis fourni par Huawei Cloud peut considérablement améliorer l'efficacité et la précision du travail. J'espère que cet article vous sera utile et j'espère que vous pourrez appliquer avec succès la technologie de transcription audio dans des projets réels !
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!