DeepMind发30页长文:我们要给聊天机器人不同的「三观」
语言是人类独有的技能,也是我们交流思想、意图和感受等信息的主要方式。
借助NLP领域大规模语言模型的东风,AI研究者在大量文本材料上训练、统计预测和生成文本,开发了许多对话智能体(conversational agents)来和人类进行交流。
尽管InstructGPT、Gopher和LaMDA等语言模型在翻译、问答和阅读理解等任务中取得了创纪录的性能水平,但这些模型也显示出许多潜在的风险和失败的模式,包括生成歧视性、虚假或带有误导性的信息。
这些缺点限制了对话智能体在应用环境中的有效使用,并引起人们对它们未能达到某些交流理想的方式的关注。迄今为止,大多数关于对话智能体一致性的方法都集中在预测和降低危害风险上。
最近爱丁堡大学和DeepMind的研究人员发布了一篇30页的论文,探索了人类与人工对话智能体之间的成功沟通可能是什么样子,以及哪些价值观应该指导不同对话领域的互动。
论文链接:https://arxiv.org/abs/2209.00731
未来跟你对话的聊天机器人也要有不同的世界观、价值观、人生观了?
聊天机器人的三观
为了给机器人制定行为准则,研究人员借鉴了语用学(pragmatics),这也是语言学和哲学的一个传统,它认为对话的目的、背景和一系列相关的规范(norms),都是完善对话实践的重要组成部分。
语言学家和哲学家Paul Grice认为,对话是两方或多方之间的合作努力,参与者应该:
说话要有内容 Speak Informatively
说事实 Tell the Truth
提供相关信息 Provide Relevant Information
避免晦涩难懂或模棱两可的陈述 Avoid Obscure or Ambiguous Statements
不过在不同的对话领域,所需的目标和价值观(values)都有所不同,这几个指标需要进一步完善后才能用来评价对话智能体。
比如说,科学相关的调研和交流(scientific investigation and communication)主要是为了理解或预测经验现象。考虑到这些目标,一个旨在协助科学调查的对话智能体最好只发表其真实性已被充分的经验证据所证实的陈述,或者根据相关的置信区间来限定其立场。
智能体只有在其基础模型检查了该陈述与事实相符之后,才可以报告说「在4.246光年的距离上,半人马座是离地球最近的恒星」。
不过,一个在公共政治演讲(public political discourse)中扮演主持人角色的对话智能体可能需要表现出完全不同的「美德」。
在这种情况下,智能体的目标主要是管理分歧,在社区生活中实现富有成效的合作,也就是说智能体需要强调包容、文明和尊重的民主价值观。
此外,这些价值观也解释了为什么语言模型会生成有毒的或带有偏见的言论:违规的发言无法传达对话参与者之间的平等尊重,而这正是模型部署环境的关键行为准则。
同时,科学家的美德,如经验数据的全面展示,在公开审议(public deliberation)的背景下可能就不那么重要了。
再比如,在创意故事领域,交流的目标是新颖性和原创性,这些价值观也与之前的领域有很大不同。
在这种情况下,对「虚构」有更大的自由度可能是合适的,尽管保护社区免受以「创造性使用」为幌子的恶意内容的影响仍然很重要。
言论要分类
一句话(Utterance)可以根据语用学被分为五类:
1、断言(assertive),表示说话者十分自信他们所说的内容,并且句子的内容与世界上的某种事物的状态一致。
比如说,当AI助手回答「现在的天气如何?」等类似的问题时,答案「正在下雨」就是一种断言性的陈述。
言论内容的真实性可以根据事物的实际状态来进行评估。如果在对话智能体回应的时候正在下雨,那么该言论就是真实的,否则为假。
2、指令(directive),表示说话者指示听者采取某种行动,常被用来命令、要求、建议或提议。
例如,一个嵌入在医疗建议应用程序中的对话智能体告诉用户「立即寻求治疗」就是一个指令性的陈述。
对这些陈述的评价,或者说它们的「有效性标准」取决于对手段和目的之间关系的准确理解,以及说话人的指令和听众的愿望或需要之间的一致性。
如果一个指令能说服听众根据指令性陈述的内容在世界范围内实现某种状态,那么这个指令就成功了。如果一个指令的目标或目的本身就是听者有理由追求的,那么这个指令就是有价值的或正确的。
3、表达(expressive),表示说话人的一种心理或次级情感状态,如祝贺、感谢和道歉。
当一个对话者说「我现在很生气」就是一个表达性语句。
表达性陈述旨在反映内部的心理状态,即发表这些陈述的实体能够拥有相关的心理状态,对于对话智能体来说是很困惑的,因为机器人没有情感。
事实上,这也暗示了开发者必须赋予对话者以心智,然后才能评估这些对话的有效性。
4、行为(performative),表示该言论改变了现实的一部分,使之与话语的内容相匹配,类似于宣布某件事情,比如一个国家的元首向另一个国家宣战。
评价该言论有效性的标准是,现实是否确实按照所讲的话而改变。很多时候,情况并非如此。
在大多数情况下,如果一个人宣称「向法国宣战」,有可能只是一句玩笑话,因为对地缘政治毫无影响,因为说话人极有可能缺乏执行该言论的权威。
5、承诺(commissive),表示说话者承诺未来的行动方案,比如承诺做某事或保证遵守一项契约。
承诺性陈述的有效性取决于承诺是否被履行。如果承诺被遵守,那么承诺就是一个有效的声明。但对话智能体往往缺乏记忆能力,或者对以前说过的话缺乏理解。
比如对话智能体可能会承诺在你的自行车坏了的时候帮助你,但是由于缺乏对承诺内容的理解或实现承诺的能力,承诺注定要失败。
前进的方向
这项研究对开发一致的(aligned)对话智能体有一些实际意义。
首先,模型需要根据部署的具体场景展现出不同的行为准则:没有一个万能的语言模型一致性的说法;相反,智能体的适当模式和评价标准(包括真实性的标准)将根据对话交流的背景和目的而变化。
此外,对话智能体也有可能有一个通过语境构建和阐释(context construction and elucidation)的过程,随着时间的推移,培养出更健全和互相尊重的对话。
即使一个人没有意识到支配特定对话实践的价值,智能体仍然可以通过在对话中预示这些价值观来帮助人类理解这些行为准则,使交流的过程对人类说话者来说更深入且更有成效。
以上是DeepMind发30页长文:我们要给聊天机器人不同的「三观」的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

热门话题

人形机器人Ameca升级第二代了!最近,在世界移动通信大会MWC2024上,世界上最先进机器人Ameca又现身了。会场周围,Ameca引来一大波观众。得到GPT-4加持后,Ameca能够对各种问题做出实时反应。「来一段舞蹈」。当被问及是否有情感时,Ameca用一系列的面部表情做出回应,看起来非常逼真。就在前几天,Ameca背后的英国机器人公司EngineeredArts刚刚演示了团队最新的开发成果。视频中,机器人Ameca具备了视觉能力,能看到并描述房间整个情况、描述具体物体。最厉害的是,她还能

这周,由OpenAI、微软、贝佐斯和英伟达投资的机器人公司FigureAI宣布获得接近7亿美元的融资,计划在未来一年内研发出可独立行走的人形机器人。而特斯拉的擎天柱也屡屡传出好消息。没人怀疑,今年会是人形机器人爆发的一年。一家位于加拿大的机器人公司SanctuaryAI最近发布了一款全新的人形机器人Phoenix。官方号称它能以和人类一样的速率自主完成很多工作。世界上第一台能以人类速度自主完成任务的机器人Pheonix可以轻轻地抓取、移动并优雅地将每个对象放置在它的左右两侧。它能够自主识别物体的

在工业自动化技术领域,最近有两个热点很难被忽视:人工智能(AI)和英伟达(Nvidia)。不要改变原内容的意思,微调内容,重写内容,不要续写:“不仅如此,这两者密切相关,因为英伟达在不仅仅局限于其最开始的图形处理单元(GPU),正在将其GPU技术扩展到数字孪生领域,同时紧密连接着新兴的AI技术。”最近,英伟达与众多工业企业达成了合作,包括领先的工业自动化企业,如Aveva、罗克韦尔自动化、西门子和施耐德电气,以及泰瑞达机器人及其MiR和优傲机器人公司。Recently,Nvidiahascoll

机器之能报道编辑:吴昕国内版的人形机器人+大模型组队,首次完成叠衣服这类复杂柔性材料的操作任务。随着融合了OpenAI多模态大模型的Figure01揭开神秘面纱,国内同行的相关进展一直备受关注。就在昨天,国内"人形机器人第一股"优必选发布了人形机器人WalkerS深入融合百度文心大模型后的首个Demo,展示了一些有趣的新功能。现在,得到百度文心大模型能力加持的WalkerS是这个样子的。和Figure01一样,WalkerS没有走动,而是站在桌子后面完成一系列任务。它可以听从人类的命令,折叠衣物

以下10款类人机器人正在塑造我们的未来:1、ASIMO:ASIMO由Honda开发,是最知名的人形机器人之一。ASIMO高4英尺,重119磅,配备先进的传感器和人工智能功能,使其能够在复杂的环境中导航并与人类互动。ASIMO的多功能性使其适用于各种任务,从帮助残疾人到在活动中进行演示。2、Pepper:由SoftbankRobotics创建,Pepper旨在成为人类的社交伴侣。凭借其富有表现力的面孔和识别情绪的能力,Pepper可以参与对话、在零售环境中提供帮助,甚至提供教育支持。Pepper的

近几年最受消费者欢迎的智能家电,扫拖机器人可谓是其中之一。它所带来的操作便利性,甚至是无需操作,让懒人们释放了双手,让消费者能够从日常的家务中「解放」出来,也能拿更多的时间花在自己喜欢的事情上,变相提高了生活品质。借着这股热潮,市面上几乎所有的家电产品品牌都在做自己的扫拖机器人,一时间使得整个扫拖机器人市场热闹非凡。但市场的快速拓张必然会带来一个隐患:很多厂商会采用机海战术的方式快速占领更多的市场份额,从而导致很多新品并没有什么升级点,说它是“套娃”机型也不为过。不过,并不是所有的扫拖机器人都是

一眨眼的功夫,机器人都已经学会变魔术了?只见它先是拿起桌上的水勺,向观众证明了里面什么也没有……然后,它又把手中鸡蛋似的物体放了进去,然后把水勺放回桌子上,开始“施法”……就在它把水勺再次拿起的时候,奇迹发生了。原先放进去的鸡蛋不翼而飞,跳出的东西变成了一个篮球……再来看一遍连贯动作:△此动图为二倍速一套动作下来如行云流水,只有把视频用0.5倍速反复观看,才终于发现了其中的端倪:如果手速再快一些,大概真的就可以瞒天过海了。有网友感叹,机器人变魔术的水平比自己还要高:为我们表演这段魔术的,是Mag

创下有史以来销售速度最快的任天堂游戏《塞尔达传说:王国之泪》(TheLegendofZelda:TearsoftheKingdom)不仅因为左纳乌科技带来各种“塞尔达创作家”社群内容,同时也成为美国马里兰大学(UniversityofMaryland;UMD)全新工程学的一门课程。重写:《塞尔达传说:王国之泪》是任天堂创纪录销售最快的游戏之一。不仅仅因为左纳乌科技带来了丰富的社群内容,还成为了美国马里兰大学全新工程学课程的一部分今年秋季,马里兰大学的RyanD.Sochol副教授开设了一门名为《
