Meta は最近、AI 翻訳スイートである Seamless Communication をリリースしました。このスイートには 4 つの AI モデルが含まれています。メタは、この AI スイートは話者の感情を正確に再現でき、わずか 2 秒の遅延で同時通訳機能を実現できるほか、100 近くの言語での入力もサポートできると主張しています。
シームレスコミュニケーションはメタ社が自社のAI研究組織「Fundamental AI Research」設立10周年を記念して発表した研究成果であると報じられています。
Meta氏によると、キットには翻訳を高速化する「第2世代SeamlessM4Tモデル」、通訳モデル「Seamless Expressive」、同時翻訳モデル「Seamless Streaming」、総合モデル「Seamless」が含まれているという。以下は IT House によってまとめられた関連情報です:
シームレス M4T モデルは、ユーザーの話した内容に基づいて、翻訳プロセス中に後続の可能性のあるテキストを自動的に関連付けて、翻訳を高速化できると主張しています。
Seamless Expressiveは、従来のAI翻訳ではユーザーのイントネーションや間、単語の強調を把握できないという課題を解決し、ユーザーの感情や文体、文体を保持したまま翻訳できるとされる通訳モデルです。品質: 翻訳されたコンテンツにより多くの感情的な情報をもたらすための話速、間、リズム
シームレス ストリーミングは、2 秒の遅延で音声とテキストの翻訳を提供することに重点を置いた同時通訳モデルで、リアルタイム通訳、音声からテキストへの翻訳 (S2TT)、および自動音声認識 (ASR) をサポートします。
包括的なモデル Seamless は、上記の 3 つの言語モデルを統合して、普遍的なシナリオを促進します。
現在、Meta は GitHub と HuggingFace Web サイトでサンプル ビデオを公開しています。興味のある方はここをクリックしてご覧ください。
以上がMeta が AI 翻訳スイートのシームレスなコミュニケーションを発表の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。