社群

學習

工具庫

AI工具

休閒

繁体中文

首頁 > 科技週邊 > 人工智慧 > Meta 推出音訊轉影像 AI 框架，用於產生人物對話場景的配音

Meta 推出音訊轉影像 AI 框架，用於產生人物對話場景的配音

PHPz

發布： 2024-01-13 11:39:06

轉載

1084 人瀏覽過

IT之家1 月9 日消息，Meta 日前公佈了一項名為audio2photoreal 的AI 框架，該框架能夠生成一系列逼真的NPC 人物模型，並藉助現有配音文件自動為人物模型「對口型”“擺動作”。

用配音生成人物对话场景，Meta 推出 audio2photoreal AI 框架

用配音生成人物对话场景，Meta 推出 audio2photoreal AI 框架

▲ 圖源 Meta 研究報告（下同）

IT之家從官方研究報告中得知，Audio2photoreal 框架在接收到配音文件後，首先生成一系列NPC 模型，之後利用量化技術及擴散算法生成模型用動作，其中量化技術為框架提供動作樣本參考、擴散演算法用於改善框架產生的人物動作效果。

研究人員提到，該框架可以產生30 FPS 的“高質量動作樣本”，還能模擬人類在對話中“手指點物”、“轉手腕”或“聳肩”等不由自主的“習慣性動作」。

用配音生成人物对话场景，Meta 推出 audio2photoreal AI 框架

用配音生成人物对话场景，Meta 推出 audio2photoreal AI 框架

研究人員引用自家實驗結果，在對照實驗中有43% 的評估者對框架生成的人物對話場景感到“強烈滿意”，因此研究人員認為Audio2photoreal 框架相對於業界競品能夠生成“更具動態和表現力」的動作。

用配音生成人物对话场景，Meta 推出 audio2photoreal AI 框架

據悉，研究團隊目前已經在 GitHub 公開了相關程式碼和資料集，有興趣的小夥伴可以點此存取。

以上是Meta 推出音訊轉影像 AI 框架，用於產生人物對話場景的配音的詳細內容。更多資訊請關注PHP中文網其他相關文章！

上一篇：透過榮耀MagicOS 8.0發布，探討意圖辨識在人機互動中的優勢所在下一篇：榮耀推出MagicOS 8.0，實現了首次意圖辨識人機互動功能

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

作者最新文章

ASFAFASFASFASFASF

2025-02-28 14:37:10
不受歡迎的意見：成為一名好數據科學家比以往任何時候都更難

2025-02-26 03:55:10
DeepSeek-V3解釋了1：多頭潛在註意力

2025-02-26 03:00:17
如何使用Verifai輕鬆部署本地生成搜索引擎

2025-02-25 23:04:13
了解chatgpt的演變：第2部分＆＃8211; GPT-2和GPT-3

2025-02-25 21:02:11
為什麼在長篇小說模型的時代仍然有意義

2025-02-25 19:31:14
超越因果語言建模

2025-02-25 18:28:09
LLMS合成數據生成

2025-02-25 16:54:10
如何重置YouTube算法

2025-02-24 12:34:11
4個智能用途用於舊的Mac

2025-02-24 12:29:09

最新問題

如何使用Yolo V12進行對象檢測？

2025-03-22 11:07:21
2025年2月的Genai推出前5名：GPT-4.5，Grok-3等！

2025-03-22 10:58:15
Uber的指南H3用於空間索引

2025-03-22 10:54:14
R.E.D。：與專家代表團的縮放文本分類

2025-03-22 10:33:09
DeepSeek #opensourceweek第6天：推理系統概述

2025-03-22 10:26:10

相關專題

更多>

熱門推薦

熱門教學

更多>

相關教學

熱門推薦

最新課程

最新ThinkPHP 5.1全球首發影片教學(60天成就PHP大牛線上訓練課程)

1440305
php入門教程之一週學會PHP

4301695
JAVA 初級入門影片教學

2689445
小甲魚零基礎入門學習Python影片教學

518199
PHP 零基礎入門教學

879986

最新下載

更多>

網站特效

網站源碼

網站素材

前端模板