Python を使用して Huawei Cloud インターフェースに接続し、音声転写機能を実装する方法を説明します
現代社会では、音声認識技術の幅広い応用がさまざまな分野でトレンドになっています。さらに分析や処理を行うために、音声ファイルをテキストに変換する必要があることがよくあります。 Huawei Cloud は強力な音声転写サービスを提供します。この記事では、Python を使用して Huawei Cloud インターフェイスに接続し、音声転写機能を実装する方法を説明します。
ステップ 1: Huawei Cloud アカウントを登録し、プロジェクトを作成する
まず、Huawei Cloud アカウントを登録し、新しいプロジェクトを作成する必要があります。 Huawei Cloud コンソールにログインし、新しいアクセス キーを作成し、後続の手順で使用するアクセス キー ID とアクセス キー シークレットを書き留めます。
ステップ 2: 必要な Python ライブラリをインストールする
Huawei Cloud インターフェイスに接続する前に、Python HTTP ライブラリと Alibaba Cloud SDK をローカルにインストールする必要があります。ターミナルまたはコマンド ライン ウィンドウを開き、次のコマンドを実行して必要なライブラリをインストールします。
pip install requests pip install huaweicloud-sdk-core pip install huaweicloud-sdk-asr
ステップ 3: トランスコーディング コードを作成します
次に、Python でコードを作成し、Huawei に接続します。クラウド インターフェイスと、クラウド インターフェイスが提供する音声転写サービスを活用してください。まず、必要なライブラリをインポートします:
import requests from huaweicloudSdkcore.auth.credentials import GlobalCredentials from huaweicloudSdkcore.region.region import Region from huaweicloudSdkasr.v1 import asrClient from huaweicloudSdkasr.v1.region.region import Region from huaweicloudSdkcore.exceptions import exceptions
次に、手順 1 で記録したアクセス キー ID とアクセス キー シークレット、オーディオ ファイル パス、オーディオ形式など、Huawei Cloud インターフェイスに必要ないくつかのパラメータを定義します。 :
ak = "your_access_key_id" sk = "your_access_key_secret" project_id = "your_project_id" region = "cn-north-1" audio_file = "/path/to/your/audio/file.wav"
次に、Huawei Cloud インターフェイスのクライアントを作成します:
credentials = GlobalCredentials.get_credentials(ak, sk) asr_client = asrClient.AsrClient.new_builder() .with_http_config(http_proxy=None, https_proxy=None, no_proxy=None) .with_credentials(credentials) .with_default_headers({"x-language": "zh-cn"}) .with_region(Region(region)) .build()
次に、オーディオ ファイルのバイナリ データを読み取り、Base64 エンコードに変換します:
with open(audio_file, mode='rb') as file: audio_data = file.read() audio_base64 = base64.b64encode(audio_data).decode()
最後に、Huawei Cloud インターフェイスを呼び出し、音声データを文字起こし用のインターフェイスに渡し、文字起こし結果を取得します。
request_body = { "data": audio_base64, "encode_type": "wav", "sample_rate": 16000 } response = asr_client.create_task(request_body=request_body, project_id=project_id).result task_id = response.body["result"]["task_id"] while response.body["status"] != "done": response = asr_client.get_task_result(task_id=task_id, project_id=project_id).result time.sleep(1) result = response.body["result"]["result"]
この時点で、音声文字起こし機能は正常に完了しました。文字起こし結果を印刷するか、テキスト ファイルとして保存します。
print(result) with open("/path/to/your/output/file.txt", mode='w', encoding='utf-8') as file: file.write(result)
上記は、Python を使用して Huawei Cloud インターフェイスに接続し、音声文字起こし機能を実装する完全なコード例です。
概要:
この記事の紹介とコード例を通じて、Python を使用して Huawei Cloud インターフェイスに接続し、オーディオ ファイルのトランスコーディング機能を実装する方法を学びました。音声転写は、音声認識、音声翻訳など、多くのシナリオで重要な用途に使用されます。 Huawei Cloudが提供する効率的で正確な音声文字起こしサービスを利用すると、作業効率と精度が大幅に向上します。この記事があなたのお役に立てば幸いです。また、音声トランスクリプション技術を実際のプロジェクトにうまく適用できることを願っています。
以上がPython を使用して Huawei Cloud インターフェースに接続し、オーディオトランスコーディング機能を実装する方法を説明しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。