Amazon Transcribe は、開発者が音声をテキストに変換する機能をアプリケーションに簡単に追加できるようにする、フルマネージドの自動音声認識 (ASR) サービスです。 [AWS]
他にも様々な機能があります。 Amazon Transcribe の機能とユースケースの詳細については、Web サイトを参照してください。
唯一の前提条件は、Transcribe と S3 にアクセスするための十分な権限を持つ AWS アカウント を持っていることです。 Transcribe は、AWS コンソールから、または複数の言語で利用可能な AWS SDK を通じて使用できます。このデモでは、Python 3.10 ランタイムで Lambda 関数を利用して Transcribe API を呼び出します。
Lambda 関数を作成する前に、文字起こしするメディア ファイルを保存するように S3 バケットが設定されていることを確認してください。
次のパラメータを使用してテスト イベントを作成します:
{ "MediaFileUri": "s3://your-bucket-name/media-file.mp4" }
Lambda 関数をデプロイします。
テストイベントを実行します。次のような応答が返されます:
AWS マネジメントコンソールで AWS Transcribe サービスに移動し、文字起こし出力を確認してダウンロードします。
次のパラメータを使用してテスト イベントを作成します:
{ "MediaFileUri": "s3://your-bucket-name/media-file.mp4" }
Lambda 関数をデプロイします。
テストイベントを実行します。次のような応答が返されます:
Amazon Transcribe を使用してメディアファイルの文字起こしを生成する方法を学習しました。
S3 に保存されているメディア ファイルの文字起こしジョブを作成し、文字起こしをダウンロードするための 2 つのラムダ関数をセットアップしました。
何か新しいことを学んでいただければ幸いです。
この記事が気に入ったら、必ずハートを付けて、提案やフィードバックをコメントしてください。
以上が簡単なステップで Amazon Transcribe を始めましょうの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。