机器人落地「秘诀」:持续学习、知识迁移和自主参与
本文转自雷锋网,如需转载请至雷锋网官网申请授权。
2022年5月23日,一年一度的机器人技术领域的顶级国际会议 ICRA 2022 (IEEE International Conference on Robotics and Automation) 在美国费城如期举行。
这是ICRA举办的第39个年头。ICRA 是 IEEE 机器人和自动化学会的旗舰会议,也是机器人研究者展示和讨论他们工作的主要国际论坛。
在今年的ICRA上,亚马逊的三位首席机器人专家,Sidd Srinivasa、 Tye Brady 和 Philipp Michel 简单讨论了在现实世界中构建人机互动的机器人系统所面临的挑战。
图注:从左到右为亚马逊机器人人工智能主管 Sidd Srinivasa,亚马逊机器人公司(全球)首席技术专家 Tye Brady,以及亚马逊 Scout 应用科学高级经理 Philipp MichelSidd
Srinivasa是全球知名的机器人专家,IEEE Fellow,现任华盛顿大学波音特聘教授,同时是 Amazon 机器人人工智能项目的负责人,负责管理协助 Amazon 物流中心员工的自主机器人的算法,研究可以收拾和包装产品的机器人和可自主搬卸和运输货物的推车式机器人。
Tye Brady是亚马逊机器人公司(全球)首席技术专家,MIT航空航天工程硕士背景。而Philipp Michel与Sidd Srinivasa同为CMU机器人研究所的博士校友,是亚马逊Scout机器人项目的高级经理。
在探讨解决机器人落地挑战的问题上,他们提出了自己的看法。AI科技评论作了不改原意的整理,如下:
Q: 你们在机器人领域的研究分别解决不同的问题,这些问题之间有什么相同点?
Sidd Srinivasa:机器人研究的一个重要难点是:我们生活在一个开放的世界中。我们甚至不知道即将面对的「输入」是什么。在我们的营运中心,我需要操控超过2000万件物品,而且这些物品还以每天成千上百件的数量在增加。大部分时候,我们的机器人并不清楚它们所拾起的物品是什么,但它们需要小心地拾起物品,并在不损坏物品的前提下将物品进行快速包装。
Philipp Michel:对于Scout来说,难点是在人行道上遇到的物体,以及运送的环境。我们在美国四个州都部署了私人送货设备。天气状况、光照条件……我们从一开始就明确要处理大量的变量,使机器人能够适应复杂的环境。
Tye Brady:在开发执行机器人的过程中,我们有一个显著的优势,就是在半结构化的环境中展开运营。我们可以自行制定机器人的交通规则,了解环境真的有助于我们的科学家和工程师深入理解我们要移动、操作、分类和识别的物体,完成订单。也就是说,我们可以在真实世界中实现对技术的追求。
Philipp Michel :还有另一个共同点,就是我们非常依赖从数据中学习,以解决问题。Scout 会在执行任务的过程中接收真实世界的数据,然后不断迭代开发用于感知、定位和导航的机器学习解决方案。
Sidd Srinivasa:我完全同意(从数据中学习解决问题)。我认为机器学习和自适应控制是超线性规模拓展的关键。如果我们部署了成千上万的机器人,我们不可能有成千上万的科学家和工程师来研究它们,我们需要依赖真实世界的数据,实现超线性地增长。
另外,我认为开放的世界会迫使我们思考怎样「持续学习」。我们的机器学习模型往往是基于一些输入数据分布来训练的,但因为这是一个开放的世界,会遇到「协变量转移」(covariate shift)的问题,也就是看到的数据与分布不匹配,这会导致机器学习模型常常没来由地过于自信。
因此,我们所做的大量工作就是创建一个「watchdogs」(看门狗,一种监督设备),用来识别输入数据分布何时偏离了它所受训的分布。然后,我们再进行「重要性抽样」(importance sampling),这样我们就可以挑选出已经改变的数据,重新训练机器学习模型。
Philipp Michel:这也是为什么我们想要在不同的地方训练机器人的原因之一,这样我们就可以尽早知道机器人可能遇到的现实数据,反过来迫使我们开发能够解决新数据的方案。
Sidd Srinivasa:这的确是个好主意。拥有多机器人的优点之一就是系统能够识别出变化的内容,重新进行训练,然后将这些知识分享给其他机器人。
想到一个分拣机器人的故事:在世界的某个角落,一个机器人遇到一个新的包装类型。一开始,它很困扰,因为它从来没有见过这种情况,也无法识别出来。后来出现了一个新的解决方案:这只机器人可以将新的包装类型传输给世界上所有机器人。如此一来,当这种新包装类型出现在其他地方,其余机器人就知晓如何处理了。相当于有了一个「备份」,新的数据出现在一个点,其他点都会知道,因为系统已经能够重新自我训练、并分享信息了。
Philipp Michel:我们的机器人也在做类似的事情。如果我们的机器人遇到之前没有遇到过的新障碍,我们会尝试调整模型来识别与处理这些障碍,随后将新的模型部署到所有的机器人上。
让我夜不能寐的一件事情是,我们的机器人会在人行道上遇到新的物体,但这些物体在接下来的三年都不会再遇到,例如:人们在万圣节上用来装饰草坪的滴水兽,或者人们在野餐的桌子上放一把伞、使桌子看起来不像「野餐桌」。对于这种情况,所有的机器学习算法都无法识别出这是一张野餐桌。
因此,我们的部分研究还是关于如何平衡无需纠结的普通事物与具体类别的事物。如果这是一个敞开的井盖口,那么机器人一定要善于识别,不然它会掉下去。但如果它只是一个随机的盒子,我们可能就不需要知道这个盒子的层次结构,只需要知道这是我们要绕过去的物体即可。
Sidd Srinivasa:另一个挑战是,当你改变你的模型时,可能会出现意想不到的后果。改变后的模型也许不会影响机器人的感知,但可能会改变机器人「刹车」方式,导致两个月后滚珠轴承磨损。在端到端的系统中,未来许多有趣的研究都是关于“理解系统部分更改对整个系统性能的影响”。
Philipp Michel:我们花了很多时间思考是否应该划分机器人堆栈的不同部分。在他们之间做整合能够带来很多好处,但也是有限的。一个极端情况是摄像头到电机到扭矩的学习,这在任何现实世界的机器人应用中都是非常具有挑战性的。还有就是传统的机器人堆栈,它被很好地分成了定位、感知、规划和控制等部分。
我们还花了很多时间思考堆栈应该如何随着时间的推移而发展,把这些部分更紧密地结合在一起时性能有什么提升?同时,我们希望有一个系统尽可能地保持可解释性。我们试图最大化利用整个堆栈的学习组件集成,同时保留可解释性和安全功能的数量。
Sidd Srinivasa:这个观点很赞,我完全同意 Philipp 的观点,用一个模型来统治所有模型未必是正确的。但通常,我们最终建立的机器学习模型共享一个主干,有多个应用的头。一个物体是什么,分割一个物体意味着什么?可能类似于挑选、堆放或者包装,但是每一个都需要专门的头,搭载在专门任务的主干上。
Philipp Michel:我们考虑的一些因素是电池、行程、温度、空间和计算限制。因此,我们需要高效使用我们的模型、优化模型、并尝试尽可能多地利用共享主干,就像 Sidd 提到的,不同的头用于不同的任务。
图注:Amazon Scout 是一个自动送货机器人,它可以在公共人行道上以步行的速度移动,目前正在美国四个州进行实地测试。
Q:当我问及你们项目之间的共性时,我想到的一件事是你们的机器人都是和人类在同样的环境中工作。为什么这会使问题复杂化呢?
Sidd Srinivasa:机器人正在走近人类生活,我们必须尊重发生在人类世界中的所有复杂的互动。除了走路、开车、执行任务外,还有复杂的社交。对机器人来说重要的是,首先,要有意识;其次,要参与其中。
这真的很难,当你在开车的时候,有时很难判断其他人在想什么,也很难根据他们的想法来决定如何行动。仅仅是推理问题就很难,然后闭环就更难了。
如果机器人正在下棋或与人对弈,那么预测他们将要做什么就容易多了,因为规则已经很好地制定了。如果你假设你的对手是最优的,那么你会做得很好,即使他们是次优的。这在某些双人游戏中是种保证。
但实际情况并非如此,我们在玩这种确保双赢的合作博弈发现,博弈时其实很难准确预测,即便合作者也是好意。
Philipp Michel:而且人类世界的行为变化很大。有的宠物完全无视机器人,有的宠物会走向机器人。行人也是如此,有些人对机器人视而不见,而有些人则径直走近它。特别是孩子,他们的好奇心超强,互动非常密切,我们需要能够安全地处理所有相处场景,这些可变性让人跃跃欲试。
以上是机器人落地「秘诀」:持续学习、知识迁移和自主参与的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

热门话题

根据最新消息,亚马逊已经宣布停产其高端电子阅读器KindleOasis,并已从美国市场下架。这一举动表明,曾经备受瞩目的KindleOasis正式退出市场。尽管在加拿大和英国等一些海外市场仍有少量库存,但一旦售罄,将不再继续供应。这标志着这款备受好评的高端阅读器即将成为过去。KindleOasis因其出色的性能和设计而备受用户喜爱,然而,随着市场需求的变化和新产品的推出,亚马逊可能已经决定停产这款产品。尽管KindleOasis在市场上留下了一定的影响力,但亚马逊可能已经将重心转移到其他产品线上

人形机器人Ameca升级第二代了!最近,在世界移动通信大会MWC2024上,世界上最先进机器人Ameca又现身了。会场周围,Ameca引来一大波观众。得到GPT-4加持后,Ameca能够对各种问题做出实时反应。「来一段舞蹈」。当被问及是否有情感时,Ameca用一系列的面部表情做出回应,看起来非常逼真。就在前几天,Ameca背后的英国机器人公司EngineeredArts刚刚演示了团队最新的开发成果。视频中,机器人Ameca具备了视觉能力,能看到并描述房间整个情况、描述具体物体。最厉害的是,她还能

C++中机器学习算法面临的常见挑战包括内存管理、多线程、性能优化和可维护性。解决方案包括使用智能指针、现代线程库、SIMD指令和第三方库,并遵循代码风格指南和使用自动化工具。实践案例展示了如何利用Eigen库实现线性回归算法,有效地管理内存和使用高性能矩阵操作。

在工业自动化技术领域,最近有两个热点很难被忽视:人工智能(AI)和英伟达(Nvidia)。不要改变原内容的意思,微调内容,重写内容,不要续写:“不仅如此,这两者密切相关,因为英伟达在不仅仅局限于其最开始的图形处理单元(GPU),正在将其GPU技术扩展到数字孪生领域,同时紧密连接着新兴的AI技术。”最近,英伟达与众多工业企业达成了合作,包括领先的工业自动化企业,如Aveva、罗克韦尔自动化、西门子和施耐德电气,以及泰瑞达机器人及其MiR和优傲机器人公司。Recently,Nvidiahascoll

机器之能报道编辑:吴昕国内版的人形机器人+大模型组队,首次完成叠衣服这类复杂柔性材料的操作任务。随着融合了OpenAI多模态大模型的Figure01揭开神秘面纱,国内同行的相关进展一直备受关注。就在昨天,国内"人形机器人第一股"优必选发布了人形机器人WalkerS深入融合百度文心大模型后的首个Demo,展示了一些有趣的新功能。现在,得到百度文心大模型能力加持的WalkerS是这个样子的。和Figure01一样,WalkerS没有走动,而是站在桌子后面完成一系列任务。它可以听从人类的命令,折叠衣物

这周,由OpenAI、微软、贝佐斯和英伟达投资的机器人公司FigureAI宣布获得接近7亿美元的融资,计划在未来一年内研发出可独立行走的人形机器人。而特斯拉的擎天柱也屡屡传出好消息。没人怀疑,今年会是人形机器人爆发的一年。一家位于加拿大的机器人公司SanctuaryAI最近发布了一款全新的人形机器人Phoenix。官方号称它能以和人类一样的速率自主完成很多工作。世界上第一台能以人类速度自主完成任务的机器人Pheonix可以轻轻地抓取、移动并优雅地将每个对象放置在它的左右两侧。它能够自主识别物体的

本站7月31日消息,科技巨头亚马逊于周二在美国特拉华州联邦法院起诉了芬兰电信公司诺基亚,指控其侵犯了亚马逊十几项与云计算技术相关的专利。1.亚马逊在诉讼中表示,诺基亚滥用了亚马逊云计算服务(AWS)的相关技术,包括云计算基础设施、安全和性能方面的技术,来加强其自身的云服务产品。诉状称,亚马逊于2006年推出了AWS,其开创性的云计算技术早在2000年代初期就开始研发。“亚马逊是云计算领域的先驱,现在诺基亚却在未经许可的情况下使用亚马逊的专利云计算创新成果,”诉状中写道。亚马逊要求法院发布禁令,阻

以下10款类人机器人正在塑造我们的未来:1、ASIMO:ASIMO由Honda开发,是最知名的人形机器人之一。ASIMO高4英尺,重119磅,配备先进的传感器和人工智能功能,使其能够在复杂的环境中导航并与人类互动。ASIMO的多功能性使其适用于各种任务,从帮助残疾人到在活动中进行演示。2、Pepper:由SoftbankRobotics创建,Pepper旨在成为人类的社交伴侣。凭借其富有表现力的面孔和识别情绪的能力,Pepper可以参与对话、在零售环境中提供帮助,甚至提供教育支持。Pepper的
