微软在 Ignite 大会上发布了一项名为“Azure AI Speech text to speech (TTS) avatar”的AI工具,声称可以生成逼真的虚拟人物形象。这项工具已经开放给公众进行预览试用
微软表示,用户使用 Azure AI Speech text to speech (TTS) avatar,可以建立基于“输入文字说出内容”的虚拟化身,并结合现实人物照片训练,建立以真实人物为基础的“互动式聊天机器人”,可用于企业的营销、业务或客户服务等场景。
据报道,Azure AI Speech文字转语音(TTS)avatar主要由三个模块构成,分别是文字分析器、TTS声音合成器和TTS虚拟化身合成器
文字分析器会首先分析用户输入的文字内容,并生成音素序列。然后,TTS声音合成器中的TTS语音模型将预测用户输入文字的声学特征,然后合成声音。最后,神经网络声音合成模型Avatar会根据上述声学特征预测人物的唇形图像,从而最终形成虚拟化身影像
微软解释,传统虚拟化身制作费时耗工,需要建立专用拍摄环境、而拍摄剪辑后期过程也相当花成本。而当下运用微软最新的 Azure AI Speech text to speech (TTS) avatar 服务,在初次建立模型后,用户只要输入文字就可以制作各种产品介绍、互动视频等。配合微软 Azure OpenAI Service 及神经网络 TTS 功能,还能呈现更自然的互动体验。
IT之家报道称,微软举例说明,用户可以利用Azure AI Speech TTS avatar来批量制作各种视频内容,比如企业文化影片、产品介绍,或者CEO在大会上的数字分身。此外,还可以制作虚拟直播数字人、聊天机器人、业务机器人,以及线上教学的AI老师等等
微软宣布,Azure AI语音合成(TTS)虚拟形象已经在Azure订阅用户中推出,并支持多种语言。用户可以从预设的虚拟形象选项中选择所需角色,也可以自定义虚拟形象
如果用户想要自行定制虚拟化身,则需要上传一批人物视频片段,Azure 平台就会在线上处理这些视频,从而生成虚拟化身。角色本身与音源分开,用户可以选择官方提供的默认音源,也可以自行上传训练音源。
以上是微软公布 Text To Speech Avatar AI工具,可制作虚拟3D数字人的详细内容。更多信息请关注PHP中文网其他相关文章!