ホームページ テクノロジー周辺機器 AI Meta、キャラクターの会話シーンの吹き替えを生成するための音声から画像への AI フレームワークを開始

Meta、キャラクターの会話シーンの吹き替えを生成するための音声から画像への AI フレームワークを開始

Jan 13, 2024 am 11:39 AM

IT House News 1 月 9 日、Meta は最近、audio2photoreal と呼ばれる AI フレームワークを発表しました。これは、一連のリアルな NPC キャラクター モデルを生成し、既存の吹き替えファイルを利用してキャラクター モデルを自動的に「リップシンク」することができます。モーション"。

用配音生成人物对话场景,Meta 推出 audio2photoreal AI 框架

用配音生成人物对话场景,Meta 推出 audio2photoreal AI 框架

▲ 画像出典 メタリサーチレポート(以下同)

IT ハウスは、公式調査報告書から、ダビング ファイルを受け取った後、Audio2photoreal フレームワークが最初に一連の NPC モデルを生成し、次に量子化技術と拡散アルゴリズムを使用してモデル アクションを生成することを知りました。定量化技術は、モデルのアクション サンプルを提供します。フレームワークによって生成されるキャラクターやアクションの効果を向上させるために、参照拡散アルゴリズムが使用されます。

研究者らは、このフレームワークは 30 FPS で「高品質のアクション サンプル」を生成でき、会話中に「指を指す」「手首を回す」「肩をすくめる」などの無意識の「習慣的なアクション」をシミュレートすることもできると述べました。 」。

用配音生成人物对话场景,Meta 推出 audio2photoreal AI 框架

用配音生成人物对话场景,Meta 推出 audio2photoreal AI 框架

研究者らは独自の実験結果を引用しました。対照実験では、評価者の 43% がフレームワークによって生成されたキャラクターの対話シーンに「非常に満足」しました。したがって、研究者らは、Audio2photoreal フレームワークは「業界の競合製品と比較して、よりダイナミックな「表現力豊かなアクション」を実現します。

用配音生成人物对话场景,Meta 推出 audio2photoreal AI 框架

研究チームが関連するコードとデータセットを GitHub で公開したと報告されています。興味のあるパートナーは、ここをクリックしてアクセスしてください。

以上がMeta、キャラクターの会話シーンの吹き替えを生成するための音声から画像への AI フレームワークを開始の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

モデルコンテキストプロトコル(MCP)とは何ですか? モデルコンテキストプロトコル(MCP)とは何ですか? Mar 03, 2025 pm 07:09 PM

モデルコンテキストプロトコル(MCP):AIとデータのユニバーサルコネクタ 私たちは皆、毎日のコーディングにおけるAIの役割に精通しています。 Replit、Github Copilot、Black Box AI、およびCursor IDEは、AIがワークフローを合理化する方法のほんの一部です。 しかし、想像してみてください

Omniparser V2とOmnitoolを使用して地元のビジョンエージェントを構築する Omniparser V2とOmnitoolを使用して地元のビジョンエージェントを構築する Mar 03, 2025 pm 07:08 PM

MicrosoftのOmniparser V2とOmnitool:AIでGUIオートメーションに革命をもたらす 味付けされた専門家のように、Windows 11インターフェースと相互作用するだけでなく、熟練したプロのように相互作用するAIを想像してください。 MicrosoftのOmniparser V2とOmnitoolはこれを再生します

レプリットエージェント:実用的な例を備えたガイド レプリットエージェント:実用的な例を備えたガイド Mar 04, 2025 am 10:52 AM

アプリ開発の革新:レプリットエージェントに深く潜ります 複雑な開発環境と不明瞭な構成ファイルとの格闘にうんざりしていませんか? Replit Agentは、アイデアを機能的なアプリに変換するプロセスを簡素化することを目的としています。 このai-p

カーソルAIでバイブコーディングを試してみましたが、驚くべきことです! カーソルAIでバイブコーディングを試してみましたが、驚くべきことです! Mar 20, 2025 pm 03:34 PM

バイブコーディングは、無限のコード行の代わりに自然言語を使用してアプリケーションを作成できるようにすることにより、ソフトウェア開発の世界を再構築しています。 Andrej Karpathyのような先見の明に触発されて、この革新的なアプローチは開発を許可します

Runway Act-One Guide:私はそれをテストするために自分自身を撮影しました Runway Act-One Guide:私はそれをテストするために自分自身を撮影しました Mar 03, 2025 am 09:42 AM

このブログ投稿では、Runway MLの新しいAct-One Animationツールの経験をテストし、WebインターフェイスとPython APIの両方をカバーしています。約束しますが、私の結果は予想よりも印象的ではありませんでした。 生成AIを探索したいですか? PでLLMSを使用することを学びます

オブジェクト検出にYolo V12を使用する方法は? オブジェクト検出にYolo V12を使用する方法は? Mar 22, 2025 am 11:07 AM

Yolo(あなたは一度だけ見ています)は、前のバージョンで各反復が改善され、主要なリアルタイムオブジェクト検出フレームワークでした。最新バージョンYolo V12は、精度を大幅に向上させる進歩を紹介します

2025年2月のトップ5 Genai発売:GPT-4.5、Grok-3など! 2025年2月のトップ5 Genai発売:GPT-4.5、Grok-3など! Mar 22, 2025 am 10:58 AM

2025年2月は、生成AIにとってさらにゲームを変える月であり、最も期待されるモデルのアップグレードと画期的な新機能のいくつかをもたらしました。 Xai’s Grok 3とAnthropic's Claude 3.7 SonnetからOpenaiのGまで

Elon Musk&Sam Altmanは、5,000億ドルを超えるスターゲートプロジェクトを超えて衝突します Elon Musk&Sam Altmanは、5,000億ドルを超えるスターゲートプロジェクトを超えて衝突します Mar 08, 2025 am 11:15 AM

Openai、Softbank、Oracle、Nvidiaなどのハイテク大手に支援され、米国政府が支援する5,000億ドルのStargate AIプロジェクトは、アメリカのAIリーダーシップを固めることを目指しています。 この野心的な仕事は、AIの進歩によって形作られた未来を約束します

See all articles