Siri越来越“大众”,未来智能语音会有哪些突破?
对于人机交互来说,如何让机器具备良好的听觉,一直是近些年来 AI 领域不懈追求的目标。2009 年前后,深度学习模型用于开始走出学术界,而以语音唤醒、识别、增强和合成为代表的智能语音技术,也逐渐走向成熟。
一个早期典型的例子是,2011 年 siri 的诞生。智能语音成了人与机器之间的沟通交互方式的新跃迁。而后经过十余年的发展,"嘿,siri"式的人机问答已经不再局限于移动终端设备,走进千家万户,广泛应用于各个场景:家居陪伴智能音箱,方便网购的天猫精灵,会议上的同声翻译,出行时的车载语音导航助手等等。
随着越来越多的互联网企业及上游厂商在智能语音赛道的积极布局,智能语音客服、对话式 AI 应用、AI 虚拟助手等产品的取得了进一步质量提升,响应语音更自然,理解问题更准确,并且有了自己的"小情绪"。
身处数字化浪潮的时代,万物互联的趋势不可阻挡。而智能语音作为当下人机交互的关键接口,正处于与实体经济深度融合碰撞的时期。随着应用场景的进一步下沉和拓展,我们也看到不少挑战性的问题,比如:如何识别说话人身份、如何识别方言、如何消除歧义等等都是最新的研究热点。
一项技术走向成熟的背后,往往蕴含着一些潜质,这其中包括它在实际应用中的创新能力,以及它更有潜力的演进方向。展望下一个阶段,智能语音技术也必会出现新的演进趋势,例如:深度集成的AI语音芯片能否取代云端运行模型的模式?多模态融合、无监督学习、脑学科交叉融合的创新研究能否取得突破性成果?我们拭目以待。
那么,智能语音技术在各大企业中实践探索中都遇到了哪些真实的生产问题?又是如何解决的?取得了哪些进展?行业出现了哪些新变化?下一步的发展趋势又会有哪些?"AISummit全球人工智能技术大会"智能语音技术专场带给你深度思考!
8月7日,51CTO倾力打造的“AISummit全球人工智能技术大会”智能语音专场重磅来袭!
专场有哪些你感兴趣的专题内容?
专题一:作业帮语音技术实践
1.语音识别技术探索:分享端到端、高效利用数据等大规模实际应用场景下的语音识别技术,并提出了基于前缀自动机的热词技术方案。
2.语音评测技术实践:语音发音纠错技术方面结合作业帮的高并发场景,提出了多任务知识迁移、多模态特征融融合方案,很大程度上提升提升模型的因素区分能力和噪声环境下的检错能力。并针对语音评测落地难的痛点,提出了高性能的云端一体化测评技术。
3.语音合成技术框架:分享作业帮基于现有的小数据量语音技术框架进一步改进的思考与实践。
专题二:字节语音识别技术在飞书中的应用
1.语音识别技术在办公场景中的应用进程:办公邮件、即时通讯中的语音输入办公语音助手、实时字幕&会后转写。
2.解决思考:会议智能化、效率提升。
3.挑战与机遇:语音识别任务的挑战、下游任务带来的挑战、会议提供额外的信息。
4.重点算法工作介绍(端到端语音识别系统):Transducer & CIF、动态+静态热词、Context-aware。
专题三:构建高水平的语音合成系统实践
1.高水平语音合成系统背景介绍及问题分析。
2.高水平语音合成系统设计思考与实现。
3.实验评估。
4.未来工作展望。
专题四:SOUL社交场景下的智能语音技术实践之路
1.SOUL社交元宇宙场景下的端到端语音识别
2.多模态语音合成技术的构建路线
3.在语音安全和语音交互等业务场景下的应用
专题五:端到端语音识别技术在58同城的探索实践
1.语音识别在58同城的应用场景:AI智能语音应用、语音识别链路介绍、挑战与技术路线
2.基于WeNet的模型优化工作:半监督训练、Efficient Conformer、模型压缩
3.端到端语音识别的部署方案:自研引擎架构、Wenet解码服务部署、流式/非流式解码性能测试
都有哪些重量级嘉宾?
一、宋旸,作业帮首席算法专家、智能中台负责人、专场出品人
宋旸在百度工作7年,从事算法研发工作。2015年加入作业帮,为智能中台部负责人,为公司各业务输出包括数据挖掘、NLP、语音在内的中台技术能力,先后负责搜索答疑、个性化推荐、智能质检、语音评测、服务智能化调度等方向。
二、王强强,作业帮语音技术团队负责人
在加入作业帮之前,王强强曾任职于清华大学电子工程系语音处理与机器智能实验室,负责语音识别算法落地,搭建工业级解决方案。2018 年加入作业帮,负责语音相关算法研究和落地,主导了语音识别、评测、合成等算法在作业帮的落地实践, 为公司提供整套语音技术解决方案。
三、张骏,字节跳动AI Lab语音识别算法研究员
张骏长期从事语音识别、语音唤醒等语音算法研究与应用,经验丰富。2018 年加入字节跳动AI Lab智能语音团队,目前主要负责智能办公、智能硬件、智能客服等方向的语音技术方案建设。
四、谭旭,微软亚洲研究院主管研究员
谭旭,研究领域包括深度学习、自然语言/语音/音乐、AI内容生成等。研发的机器翻译和语音合成系统获得多项比赛冠军并在学术评测集上达到人类水平,研究工作如预训练语言模型MASS、语音合成模型FastSpeech/NaturalSpeech、AI音乐项目Muzic受到业界广泛关注。
五、刘忠亮,SOUL语音算法负责人
刘忠亮硕士毕业于中科院研究生院,目前在SOUL担任语音算法负责人,曾任职于搜狗AI交互部和陌陌大数据部。近10年主要从事语音唤醒、语音识别、语音合成、音频音乐理解等语音技术体系的研发工作,主要应用于输入法、手机助手、智能硬件、语音安全等语音交互和语音理解业务场景,致力于打造最好的可落地的语音技术。
六、周维,58同城 AI Lab语音算法部负责人、算法架构师
周维,58同城AI Lab语音算法部负责人、算法架构师,负责语音识别、语音合成算法研发。2016年硕士毕业于中国科学院大学,毕业后参与对话式AI产品方向创业,2018年5月加入58同城,曾先后参与智能客服、智能外呼、智能写稿等AI项目的NLP算法研发,2019年开始主攻语音算法方向,带领团队从0到1自主研发58同城语音处理引擎中的语音算法。
还有哪些精彩活动?
除了精彩的AI技术大咖的精彩的实践创新干货分享外,AISummit全球人工智能技术大会还为与会的朋友们准备了丰富的场前、场中互动福利。加入这场盛会,在拓展技术能力和人脉资源的同时,顺便惊喜礼品带回家!
活动包括"当人不让"、"工享幸运"、"智同道合"等四大妙趣横生的互动游戏,总有一款精美礼品惊艳到你!那么,传说中神秘的终极大奖会是什么呢?等待热爱技术的你来现场揭秘!(PS:听说越早预约报名,中大奖几率越高哦!)
怎么快速预约报名?
点击进入AISummit 全球人工智能技术大会 官方网站,按提示完整填写、提交信息即可完成报名。
扫码加入大会官方群,参与抽奖,赢取SONY音响、冰墩墩、AI技术书籍等精美礼品,还有红包雨掉落。
以上是Siri越来越“大众”,未来智能语音会有哪些突破?的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

热门话题

作者 | 刘忠亮整理 | 卢鑫旺审校 | 云昭近年来,智能语音语言技术蓬勃发展,逐步改变着人们生产生活的方式,在社交领域更是对智能语音技术提出了更高的要求。日前,在51CTO主办的AISummit全球人工智能技术大会上,Soul语音算法负责人刘忠亮,带来了主题演讲《Soul智能语音技术实践之路》,立足于Soul的一些业务场景,分享了Soul在智能语音技术的一些实践经验。现将演讲内容整理如下,希望对大家有所启发。Soul的语音应用场景Soul是一个基于兴趣图谱推荐的具有沉浸感的社交场景,在这个场景

1、首先点击进入【设置】。2、找到并点击打开【智能辅助】。3、点击进入【手势控制】。4、然后点击【语音助手】。5、打开【电源键唤醒】右侧的开关,长按电源键1秒即可唤醒语音助手。

作者 | 云昭用户与信息之间,要么隔着一个搜索,要么隔着一个推荐。正如百度执行副总裁沈抖在一次会议上所言:人们对搜索已经太过熟悉,以至于感受不到其中技术的变革。时至今日,搜索已经无处不在,从浏览器、微信、支付宝,到其他日常都会登录使用的App,我们习惯了用搜索来筛选自己需要的信息。“搜索”已经变成了互联网时代一项基础技术,早已不用像区块链、Web3这些新技术那般在我们的视线里狂刷“存在感”。真正重要的,往往是我们习以为常却感知不到的。在信息量爆发的大数据时代,传统搜索也随之进化到智能搜索时代。有

Python与百度智能语音接口对接的实践经验与技巧分享一、引言百度智能语音接口是一种强大的语音识别技术,可以将语音转化为对应的文字,并且支持多种场景下的语音输入,如麦克风输入、文件输入等。在实际开发中,与百度智能语音接口进行对接可以帮助我们实现语音识别、语音转写等功能。本文将分享一些Python与百度智能语音接口对接的实践经验与技巧,并提供代码示例供参考。二

盛夏八月,骄阳似火,草木蓊郁,一切都彰显着野蛮而诗意的生命力。夏天是一个探索、成长、革新的季节。在这个属于实践者的时节里,51CTO带来了一场以“驱动•创新•数智”为主题的AI盛会。AI技术诞生不足百年,几经浮沉后,在最近20年迎来了全面发展与落地的黄金时期。当前AI领域有哪些前沿技术成果和实战创新突破?如何看待AI的下一个十年?这是萦绕在众多技术人员脑海中的议题。 8月6日,AISummit 全球人工智能技术大会以线上直播形式如期开幕。首日,近百位专家学者、技术大牛、管理精英齐聚一堂

AI技术诞生不足百年,在经历了几次寒冬之后,在最近20年实现了飞跃式的发展,人工智能正逐步占领金融、信息、医疗、自动驾驶等领域。身处于这个人工智能技术全面发展与落地的黄金时期,我们该如何看待AI的下一个十年?未来AI领域技术又会出现哪些创新?由51CTO举办的「AISummit全球人工智能技术大会」将为你揭晓答案。8月6日,「AISummit全球人工智能技术大会」以线上直播形式如期开幕。在上午的主会场中,51CTO副总裁兼总编崔康、中国人民大学高瓴人工智能学院副院长窦志成、Met

随着数字化转型的浪潮推进,AI模型与算法分布式、分散式的需求越来越突出,而不同算法与模型之间的有机结合,也成了实际应用中的主流选择。除此之外,多模态、无监督、可解释性、自学习、自演化等等都是当下AI领域需要重点关注的研究方向。那么,这些AI领域的“灵魂”特性究竟有了哪些新的进展?国内外各大AI巨头又是如何将模型性能在实际落地中发挥到极致的呢?想要了解人工智能算法模型的发展与前沿探索,AISummit“算法模型的创新之道”专场不容错过!峰会专场8月6日-7日,AISummit全球人工智能技术大会将

嘉宾:卢冕整理:墨色2022年8月6日-7日,AISummit 全球人工智能技术大会如期举办。在会上,OpenMLDB 研发负责人第四范式系统架构师卢冕带来了主题演讲《开源机器学习数据库OpenMLDB:线上线下一致的生产级特征平台》,从人工智能工程化落地的数据和特征挑战、OpenMLDB线上线下一致的生产级特征计算平台、OpenMLDB v0.5:性能、成本、易用性增强,三个方面进行了分享。现将演讲内容整理如下,希望对各位有所启发。人工智能工程化落地的数据和特征挑战如今,据统计,在人
