IT House News on June 19, Meta は現在、Voicebox AI モデルをリリースしています. テキストまたは画像のみを使用して返信できる競合モデルと比較して、Voicebox AI モデルの主な利点は、その名前が示すように、返信用の音声情報。
▲ Voicebox AIモデルの特徴、画像ソースメタ
Voicebox AI モデルは、音声の詳細と音色を正確に識別し、テキスト結果に基づいて英語、フランス語、ドイツ語、スペイン語をサポートする音声出力に変換するために、2 秒の音声サンプルのみが必要であると報告されています。 Voicebox には、ボイス クリップの前後のコンテンツに基づいて、不足しているコンテンツを埋める機能もあります。
▲ Voicebox AIモデルの特徴、画像ソースメタ
▲ Voicebox AIモデルの特徴、画像ソースメタ
Meta によれば、Voicebox はメタバース内の AI ベースの仮想アシスタントや NPC に自然でリアルな音声効果を提供できるそうです。 Voicebox は、声帯を損傷した人々がバリアフリーのコミュニケーションを達成できるよう、一定の支援を提供します。
IT House が問い合わせた結果、Voicebox AI モデルはまだ研究開発段階にあることが判明しました。 Meta は、この人工知能技術が虚偽の偽造という潜在的な害をもたらす可能性があることを認識していると述べたので、Meta は現在、実際の音声と Voicebox によって生成された音声を区別する効果的な方法を見つけるために懸命に取り組んでいます。当面の間、一般公開いたします。 Voicebox モデルの詳細については、現在ここでご覧いただけます。
以上がMetaがVoicebox AIモデルをリリース:NPCの会話などの音声情報を生成できる。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。