鹅厂机器狗抢起真狗「饭碗」!会撒欢儿做游戏,遛人也贼6
让机器狗学完真狗子的运动数据,真有二哈那感觉了!
它轻松跨个栏,后面“主人”差点没跟上:
钻个“狗洞”倒是轻车熟路:
还能两只狗一起撒欢儿,它追、它逃……
这就是鹅厂机器狗的最新进展。
利用预训练模型喂给机器狗真狗子的运动数据、并通过强化学习,机器狗Max不仅在行为上更灵动,而且还能根据已经掌握的技能“举一反三”,去适应更加复杂的环境。
总结来说,就是里里外外都“更狗”了一些。
有策略地追逐撒欢儿
这次机器狗学习的新技能里,最强的一项还是玩游戏。
机器狗不仅能遵守规则,还能自己想出策略赢比赛,可能比真狗子还要聪明些。
具体来看,这是一个障碍追逐比赛,受到“World Chase Tag”启发,规则如下:
研究人员设置了不同游戏难度,最简单的就是空旷场地:
玩游戏过程里,机器狗很明显是有策略的。
比如,一般等到躲避者离棋旗子较远时,追击者才会发起猛攻,把它逼到死角,游戏结束。
如果追击者发现躲避者离旗子很近,自己根本没机会追上它时,它会先放弃追逐,等待下一个旗子出现:
有障碍物干扰也没关系,俩狗子一样玩得很6:
而能够有如此表现,并不是机器狗从一开始就拿这个游戏训练。
它其实是基于自己已经学到的一些动作、知识和技能,来应对这个游戏场景。
具体怎么实现?往下看。
学了真·狗的数据
研究一共分为三个阶段。
- 学习动物运动姿态
- 将运动姿态和外界感知联系起来
- 附加网络获取和复杂任务有关信息
第一阶段,是通过游戏中常用的动作捕捉系统,通过收集真狗的姿态数据,包括走、跑、跳、站立等动作,在仿真器中构建一个模仿学习任务。
然后将这些数据中的信息抽象并压缩到深度神经网络模型中,使其在涵盖运动姿态信息的同时,还具有一定可解释性。
腾讯RoboticsX机器人实验室和腾讯游戏合作,用游戏技术提高了仿真引擎的准确性和高效性,同时游戏制作和研发过程中积累了多元的动捕素材。
这些技术以及数据对基于物理仿真的智能体训练以及真实世界机器人策略部署也起到了一定的辅助作用。
再下一步,模型引入周边环境的感知数据,例如通过其他传感器“看到”的脚下的障碍物。
第二阶段,通过额外的网络参数,将第一阶段掌握的动物姿态和外界感知联系在一起。
这样机器狗就能通过已经学会的动作,来应对外界环境。
当机器人能够适应多种复杂的环境后,这些将动物姿态与外界感知联系在一起的知识也会被固化下来,存在神经网络结构中。
然后机器狗就能自如上楼梯了。
或者在不连续、不平整地面上奔跑:
然后就到了最后一阶段,让机器狗根据上面学会的技能,去解决实际问题
也就是上面提到的做游戏环节。
据介绍,游戏中机器狗的所有控制策略都是神经网络策略。
在仿真中进行学习并通过zero-shot transfer(零调整迁移),让神经网络模拟人类的推理方式,来识别从未见过的新事物,并把这些知识部署到真实机器人上。
比如在预训练模型中学会了躲避障碍物的知识,那么在游戏里设置障碍,机器狗也能轻松应对。
本次研究新进展由腾讯Robotics X机器人实验室带来。
该实验成立于2018年,目前推出的机器人项目包括机器狗Max一代/二代、机器狗Jamoca、轮式机器人Ollie、自平衡自动驾驶摩托车等。
One More Thing
值得一提的是,之前UC伯克利的学者也将一种“真狗子”的训练方法,用在了机器狗上。
吴恩达开山大弟子Pieter Abbeel等,让机器狗自己在地上打滚一个小时,学会了走路。
而去年腾讯发布机器狗Max二代时,一段小花絮里,这狗会“扑脚”、“撒欢跑”,确实有家里毛孩子那味儿。
(当然,如果想让它成为一只听主人话的狗, 通过指令即可对其发号施令。)
咱就是说,现在机器狗的发展方向,不朝着翻跟头卷,反倒是要和真狗子“抢饭碗”了吗?
以上是鹅厂机器狗抢起真狗「饭碗」!会撒欢儿做游戏,遛人也贼6的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

热门话题

DDREASE是一种用于从文件或块设备(如硬盘、SSD、RAM磁盘、CD、DVD和USB存储设备)恢复数据的工具。它将数据从一个块设备复制到另一个块设备,留下损坏的数据块,只移动好的数据块。ddreasue是一种强大的恢复工具,完全自动化,因为它在恢复操作期间不需要任何干扰。此外,由于有了ddasue地图文件,它可以随时停止和恢复。DDREASE的其他主要功能如下:它不会覆盖恢复的数据,但会在迭代恢复的情况下填补空白。但是,如果指示工具显式执行此操作,则可以将其截断。将数据从多个文件或块恢复到单

0.这篇文章干了啥?提出了DepthFM:一个多功能且快速的最先进的生成式单目深度估计模型。除了传统的深度估计任务外,DepthFM还展示了在深度修复等下游任务中的最先进能力。DepthFM效率高,可以在少数推理步骤内合成深度图。下面一起来阅读一下这项工作~1.论文信息标题:DepthFM:FastMonocularDepthEstimationwithFlowMatching作者:MingGui,JohannesS.Fischer,UlrichPrestel,PingchuanMa,Dmytr

如果您需要了解如何在Excel中使用具有多个条件的筛选功能,以下教程将指导您完成相应步骤,确保您可以有效地对数据进行筛选和排序。Excel的筛选功能是非常强大的,能够帮助您从大量数据中提取所需的信息。这个功能可以根据您设定的条件,过滤数据并只显示符合条件的部分,让数据的管理变得更加高效。通过使用筛选功能,您可以快速找到目标数据,节省了查找和整理数据的时间。这个功能不仅可以应用在简单的数据列表上,还可以根据多个条件进行筛选,帮助您更精准地定位所需信息。总的来说,Excel的筛选功能是一个非常实用的

谷歌力推的JAX在最近的基准测试中性能已经超过Pytorch和TensorFlow,7项指标排名第一。而且测试并不是在JAX性能表现最好的TPU上完成的。虽然现在在开发者中,Pytorch依然比Tensorflow更受欢迎。但未来,也许有更多的大模型会基于JAX平台进行训练和运行。模型最近,Keras团队为三个后端(TensorFlow、JAX、PyTorch)与原生PyTorch实现以及搭配TensorFlow的Keras2进行了基准测试。首先,他们为生成式和非生成式人工智能任务选择了一组主流

在iPhone上面临滞后,缓慢的移动数据连接?通常,手机上蜂窝互联网的强度取决于几个因素,例如区域、蜂窝网络类型、漫游类型等。您可以采取一些措施来获得更快、更可靠的蜂窝互联网连接。修复1–强制重启iPhone有时,强制重启设备只会重置许多内容,包括蜂窝网络连接。步骤1–只需按一次音量调高键并松开即可。接下来,按降低音量键并再次释放它。步骤2–该过程的下一部分是按住右侧的按钮。让iPhone完成重启。启用蜂窝数据并检查网络速度。再次检查修复2–更改数据模式虽然5G提供了更好的网络速度,但在信号较弱

哭死啊,全球狂炼大模型,一互联网的数据不够用,根本不够用。训练模型搞得跟《饥饿游戏》似的,全球AI研究者,都在苦恼怎么才能喂饱这群数据大胃王。尤其在多模态任务中,这一问题尤为突出。一筹莫展之际,来自人大系的初创团队,用自家的新模型,率先在国内把“模型生成数据自己喂自己”变成了现实。而且还是理解侧和生成侧双管齐下,两侧都能生成高质量、多模态的新数据,对模型本身进行数据反哺。模型是啥?中关村论坛上刚刚露面的多模态大模型Awaker1.0。团队是谁?智子引擎。由人大高瓴人工智能学院博士生高一钊创立,高

特斯拉机器人Optimus最新视频出炉,已经可以在厂子里打工了。正常速度下,它分拣电池(特斯拉的4680电池)是这样的:官方还放出了20倍速下的样子——在小小的“工位”上,拣啊拣啊拣:这次放出的视频亮点之一在于Optimus在厂子里完成这项工作,是完全自主的,全程没有人为的干预。并且在Optimus的视角之下,它还可以把放歪了的电池重新捡起来放置,主打一个自动纠错:对于Optimus的手,英伟达科学家JimFan给出了高度的评价:Optimus的手是全球五指机器人里最灵巧的之一。它的手不仅有触觉

这周,由OpenAI、微软、贝佐斯和英伟达投资的机器人公司FigureAI宣布获得接近7亿美元的融资,计划在未来一年内研发出可独立行走的人形机器人。而特斯拉的擎天柱也屡屡传出好消息。没人怀疑,今年会是人形机器人爆发的一年。一家位于加拿大的机器人公司SanctuaryAI最近发布了一款全新的人形机器人Phoenix。官方号称它能以和人类一样的速率自主完成很多工作。世界上第一台能以人类速度自主完成任务的机器人Pheonix可以轻轻地抓取、移动并优雅地将每个对象放置在它的左右两侧。它能够自主识别物体的
