11月10日下午,中电信人工智能总经理何忠江在人工智能与数据产业发展合作论坛上,对通用大模型的产品和思路进行了解读
何忠江首先分享了对通用人工智能的看法,他认为,通用人工智能是指能像人一样能看、能听、会思考,而能看需要视觉技术,能听需要语音技术,将视觉信息与语音信息采集到大脑之后,大脑对其进行加工判断,提供决策思路,通用大模型发挥的便是大脑的作用。当今的海量数据、先进算法、坚实算力也将推动大模型规模化发展。
阐述完基本看法后,何忠江从中国电信星辰语义大模型、中国电信星辰多模态大模型进行了详细讲解。中国电信星辰语义大模型是通用人工智能的核心,具备更优秀的能力,同时能够缓解多轮幻觉,使得“幻觉率”降低40%。未来,中国电信星辰语义大模型对外能够赋能2B2G业务,提质提效,优化体验;对内能够全面应用,提升生产协同效率,应用更为丰富。何忠江也透露,中国电信的AI团队也将参与到开源开放的行列中,将于今年年底之前开源百亿模型,明年4月开源千亿模型,所有底层代码都会开源。
何忠江介绍中国电信星辰多模态大模型时谈到,目前中国电信已训练超过12亿图文对,采用混合精度的策略显著提升GPU效率,推理提速4.5倍,多模态大模型将作为下一代数字人的基础能力底座。
通过万号智能客服声音与超自然TTS1.0的对比,何忠江称,中国电信星辰语音大模型1.0能够实现自然度媲美真人,实时流成合式语音;首包响应时间小于50毫秒;支持极小数据量声音转换和定制,进而实现更好、更快、更灵活。他也透露,2024年中将发布超自然语音合成2.0。
中国电信HR基于中国电信星辰多模态大模型,通过基础数字分身展示了任意搭配妆容配饰、个性化生成定制等功能。何忠江表示,随着大模型技术的不断增强和知识的不断丰富,数字人在虚拟空间以及机器人在现实世界对人们的生产经营生活产生的影响将越来越大,人工智能时代即将真正到来!
运营商财经(官方微信公众号yyscjrd)—— 主流财经网站,一家全面覆盖科技、金融、证券、汽车、房产、食品、医药、日化、酒业及其他各种消费品网站。
以上是中电信人工智能总经理何忠江:2024年将发布超自然语音2.0的详细内容。更多信息请关注PHP中文网其他相关文章!