阿里云宣布自研 EMO 模型上线通义 App，用照片 + 音频生成唱歌视频-IT业界-PHP中文网

阿里云宣布自研 EMO 模型上线通义 App，用照片 + 音频生成唱歌视频

王林

发布： 2024-04-26 08:00:38

转载

1125 人浏览过

“本站4月25日消息，EMO（Emote Portrait Alive）是一个由阿里巴巴集团智能计算研究院开发的框架，一个音频驱动的AI肖像视频生成系统，能够通过输入单一的参考图像和语音音频，生成具有表现力的面部表情和各种头部姿势的视频。”

阿里云今日宣布，通过实验室研发的 AI 模型 —— EMO 正式上线通用 App，并开放给所有用户免费使用。借助这一功能，用户可以在歌曲、热梗、表情包中任选一款模板，然后通过上传一张肖像照片就能让 EMO 合成演唱视频。

根据介绍，通义 App 首批上线了80多个 EMO 模板，包括热门歌曲《上春山》《野狼 Disco》等，还有网络热梗“钵钵鸡”“回手掏”等，但目前暂未提供自定义音频。

本站附 EMO 官网入口：

EMO 的主要特点

以上是阿里云宣布自研 EMO 模型上线通义 App，用照片 + 音频生成唱歌视频的详细内容。更多信息请关注PHP中文网其他相关文章！