爆火的生成式AI,能让智能音箱起死回生吗?
智能音箱这类如今几乎已经被大量消费者遗忘的产品,在此前经历了2017年、2018年的“疯狂”之后,早已不再是大多数消费者关注的对象。就在大家以为智能音箱会昙花一现时,ChatGPT的横空出世似乎让智能音箱有了焕发第二春的可能,也给了这个在走下坡路的行业一个新的机遇。那么,智能音箱与如今爆红的生成式AI能擦出火花吗?
生成式AI之于智能音箱行业,或许就是久旱逢甘霖。根据相关市场调查数据显示,2023年第一季度,受产品同质化严重和消费者需求下降等因素的叠加影响,国内智能音箱在线上的监测零售量为157万台、再次下跌40.6%,而在整个2022年,智能音箱国内全渠道销量为2631万台、同比下降了28%。
为什么曾经被各大巨头寄予厚望、甚至被视为可能是智能家庭入口的智能音箱,会在近年来滑入深渊呢?原因其实只有一个,那就是智能音箱真的不够智能。
在智能音箱这一概念火热的2017年,业界曾有关于智能音箱的重心到底应该在“智能”、还是“音质”上的讨论。最终,腾讯听听、苹果HomePod等一系列注重音质的产品,用它们的惨烈失败证明智能音箱的卖点只有可能是智能化。
然而遗憾的是,绝大多数智能音箱的智能化程度只能用“捉襟见肘”来形容,而各大厂商对于ASR(语音识别)、NLP自然语义处理、远场拾音等人工智能和声学技术的进步,又实在有些过于乐观。其实智能音箱从技术层面来说很简单,它的工作模式就是收集用户的声音,然后将音频发到服务器上、再计算并产出结果,最终将结果发送到智能音箱上变成具体的行为,比如打开某个应用或是回复用户的提问。
没错,智能音箱本身其实与人工智能并不沾边,小爱同学、小度、天猫精灵的真身藏在了相应的服务器端上。这一切也导致了决定智能音箱使用体验的关键是远场拾音技术,也就是在复杂的声学环境下准确捕捉用户语音指令的能力,毕竟总不能出现用户说“讲个笑话”,智能音箱听成“放首歌”了吧。
智能音箱的解决方案,则是使用大规模麦克风阵列来收集声音,但其中却有一个痛点一直得不到解决,那就是语音唤醒(keyword spotting)。大家在使用智能音箱时,需要用到诸如“Hi,Siri”、“小爱同学”、“小度小度”这样的唤醒词,让智能音箱知道你在和它说话,这也就意味着智能音箱缺乏主动服务的能力。更为重要的是,由于技术的限制,智能音箱长期以来只能理解简单的指令,比如“音量调大一点/调小一点”、“播放某某人的某某歌”等,再复杂一些的语句识别起来往往就很难。
而ChatGPT、文心一言这类生成式AI之于智能音箱的意义,就是前者可以帮助智能音箱理解更加复杂的语句,并提供更加自然的交流。相信使用过微软Bing Chat、百度文心一言或ChatGPT的朋友应该就知道,在与这类生成式AI对话时,并不需要用诸如“Hi,ChatGPT”这样的开场白,直接输入内容即可开始对话进程。
由于生成式AI是在基于大规模语言模型(LLM,Large Language Model)的基础上,加入了人工标注数据和从人类反馈中进行强化学习技术,再辅以知识图谱技术,即一种将知识写成结构化三元组(包含实体、概念和关系)的多关系图,让AI得以理解人类指令的含义,并最终从庞大的信息数据库中选择内容进行回答。
ChatGPT这类产品相比于Siri、小爱同学最大的变化,就是有了多轮对话的能力。相比Siri几乎是“鱼的记忆”,ChatGPT则可以一直与用户对话,再加上对于情绪更清晰的感知,让用户以为真的是在与活生生的人对话。对于一个消费级产品而言,用户显然并不在乎背后的技术原理有多么高深,而是关注它能否解决问题或是满足需求。
生成式AI的魅力就在于它的能力上限很高,其中典型的例子就是微软的Microsoft Copilot,同时它还能在一定程度上满足用户的社交需求,如今在海外已有创作者借助ChatGPT,推出了以自己为模型的“虚拟伴侣”,并收获了超过1000名用户。总的来说,将生成式AI与智能音箱结合几乎能补足后者的短板,使得其在消费级赛道拥有了可堪一用的智能化水平。
事实上,部分智能音箱厂商已经行动起来了。例如今年2月,百度在预热文心一言时,小度就已宣布将融合文心一言,打造针对智能设备场景的AI模型“小度灵机”;4月天猫精灵接入“鸟鸟分鸟”模型打造的“AI嘴替”,同时宣布接入阿里巴巴的通义千问。
但需要指出的是,生成式AI并非“万能灵药”。就目前来说,一切生成式AI都面临着一个不可避免的问题,那就是算力资源的稀缺。最近生成式AI天花板GPT-4“变笨”的消息引发了诸多关注,相比于刚刚发布时的状态,如今GPT-4的文本代码质量全方位下降已然成为了用户的共识。
没错,其实不仅是GPT-4,诸如ChatGPT、文心一言等面向公众的这类产品都出现了类似的情况,用户量的增加导致了大模型性能的下降。
现在生成式AI领域面临的核心问题,就是算力资源紧张、无法应对汹涌而来的用户,而为了确保用户体验,这类产品就只能降低大模型的性能、减少生成内容的时间来给服务器“减负”。相较之下,智能音箱的存量市场规模无疑更加庞大,所以在接入生成式AI后,几乎不可避免地会遇到类似的问题。
未来很有可能会出现的情况,是智能音箱的智能化水平呈现出一条抛物线,初期用户体验会跨越式提升,但随着用户规模的不断增加,智能化表现反而可能会“退化”回数年前的水平。
以上是爆火的生成式AI,能让智能音箱起死回生吗?的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

热门话题

·美国总统科技顾问委员会成立的生成式AI工作组旨在帮助评估人工智能领域的关键机遇和风险,并就尽可能确保公平、安全、负责地开发和部署这些技术向美国总统提供意见。·AMD的首席执行官苏姿丰(LisaSu)和谷歌云首席信息安全官菲尔·维纳布尔斯(PhilVenables)也是这个工作组的成员。华裔数学家、菲尔茨奖获得者陶哲轩。当地时间5月13日,华裔数学家、菲尔茨奖获得者陶哲轩公布消息,他和物理学家劳拉·格林(LauraGreene)共同领导美国总统科技顾问委员会(PCAST)的生成式人工智能工作组。

图片来源@视觉中国文|王吉伟从“人+RPA”到“人+生成式AI+RPA”,LLM如何影响RPA人机交互?换个角度,从人机交互看LLM如何影响RPA?影响程序开发与流程自动化人机交互的RPA,现在也要被LLM改变了?LLM如何影响人机交互?生成式AI怎么改变RPA人机交互?一文看明白:大模型时代来临,基于LLM的生成式AI正在快速变革RPA人机交互;生成式AI重新定义人机交互,LLM正在影响RPA软件架构变迁。如果问RPA对程序开发以及自动化有哪些贡献,其中一个答案便是它改变了人机交互(HCI,h

生成式AI是人类一种人工智能技术,可以生成各种类型的内容,包括文本、图像、音频和合成数据。那么什么是人工智能?人工智能和机器学习之间的区别是什么?人工智能是学科,是计算机科学的一个分支,研究智能代理的创建,这些智能代理是可以推理、学习和自主执行动作的系统。从本质上讲,人工智能与建筑像人类一样思考和行动的机器的理论和方法有关。在这个学科中,机器学习ML是人工智能的一个领域。它是根据输入数据训练模型的程序或系统,经过训练的模型可以从新的或未见过的数据中做出有用的预测,这些数据来自于训练模型的统一数据

▲本图由AI生成酷家乐、三维家、东易日盛等已出手,装饰装修产业链大举引入AIGC生成式AI在装饰装修领域有哪些应用?对设计师有啥影响?一文看懂告别各种设计软件一句话生成效果图,生成式AI正颠覆装饰装修领域使用人工智能增强能力提升设计效率,生成式AI变革装饰装修行业生成式AI对装饰装修行业有哪些影响?未来发展趋势如何?一文看懂LLM变革装饰装修,这28款流行生成式AI装修设计工具值得上手体验文/王吉伟在装饰装修领域,最近与AIGC关联的消息着实不少。Collov推出了生成式AI驱动的设计工具Col

根据市场研究公司Omdia的一份最新报告,预计到2023年,生成式人工智能(GenAI)将成为一个引人注目的技术趋势,为企业和个人带来重要的应用,包括教育。在电信领域,GenAI的用例主要集中在提供个性化营销内容或支持更复杂的虚拟助手,以提升客户体验尽管生成式AI在网络运营中的应用并不明显,但EnterpriseWeb进行了一项有趣的概念验证,展示了该领域中生成式AI的潜力生成式AI在网络自动化方面的能力和限制生成式AI在网络运营中的早期应用之一是利用交互式指导替代工程手册来帮助安装网络元件,从

亚马逊云科技大中华区战略业务发展部总经理顾凡2023年,大语言模型和生成式AI在全球市场“狂飙”,不仅引发了AI和云计算产业的“排山倒海”式跟进,也在强力吸引制造巨头们的入局。海尔创新设计中心就打造了全国首个AIGC工业设计解决方案,大幅缩短设计周期,并降低概念设计成本,不仅将整体概念设计提速了83%、集成渲染效率也提升了约90%,高效解决了设计阶段人力成本高、概念产出与通过效率低等问题。西门子中国基于自有模型的智能知识库暨智能会话机器人“小禹”,具备自然语言处理、知识库检索、通过数据训练大语言

大模型落地加速,“产业实用”成为发展共识。2024年5月17日,腾讯云生成式AI产业应用峰会在北京召开,公布大模型研发、应用产品的系列进展。腾讯混元大模型能力持续升级,多个版本模型hunyuan-pro、hunyuan-standard、hunyuan-lite通过腾讯云对外开放,满足企业客户、开发者在不同场景下的模型需求,落地最优性价比模型方案。腾讯云大模型知识引擎、图像创作引擎、视频创作引擎三大工具发布,打造大模型时代原生工具链,通过PaaS服务简化数据接入、模型精调、应用开发流程,助力企业

人工智能的崛起正在推动软件开发的快速发展。这一强大技术有可能彻底改变我们构建软件的方法,对设计、开发、测试和部署等各个方面都会产生深远影响。对于企图进入动态软件开发领域的企业来说,生成式人工智能技术的问世为它们提供了前所未有的发展机遇。将这一前沿技术纳入其开发流程后,公司可以大幅提升生产效率、缩短产品上市周期,并推出在激烈竞争的数字市场中脱颖而出的优质软件产品。根据麦肯锡的一份报告,预测到2031年,生成式人工智能市场规模有望达到4.4万亿美元。这一预测不仅反映了一种趋势,更显示出技术和商业格局
