Google は本日、Translatotron 3 と呼ばれる新しい人工知能モデルを正式に導入するプレス リリースを発行しました。このモデルは並列音声データを必要とせず、音声間の同時通訳を実現できます
Google は 2019 年に Translatotron S2ST システムをリリースし、2021 年 7 月に 2 番目のバージョンをリリースしました。 2023 年 5 月 27 日に公開された論文で、Google は Translatotron 3
をトレーニングするための新しい方法を導入していると発表しました。研究者らは、Translatotron 2 はすでに優れた翻訳品質、音声の堅牢性 (ロバスト)、および音声の自然さを提供しており、一方、Translatotron 3 は「音声から音声への直接翻訳の初の完全に教師なしのエンドツーエンド モデル」を達成していると述べています。
従来、S2ST は自動音声認識機械翻訳のテキストから音声への合成のカスケード手法によって解決されていましたが、Translatotron 3 は、中間テキスト表現に依存せずにソース言語の音声をターゲット言語に直接マッピングする新しいエンドツーエンド アーキテクチャを採用しています。
Translatotron 3 モデルは、言語障害を持つ人々を支援するツールの作成や、より魅力的で効果的なパーソナライズされた言語学習ツールの開発にも使用できます。
書き直す必要がある内容は次のとおりです: 出典: IT ホーム
以上がAI 同時通訳の新たなブレークスルー、Google が Translatotron 3 モデルをリリース: テキスト変換ステップをバイパスできるの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。