特斯拉Optimus人形机器人进厂打工,娴熟分装电池、自我矫正,还能走更远了
特斯拉人形机器人又解锁了新技能!
昨日,Tesla Optimus 官方发布了新的 demo 视频,展示了二代 Optimus 人形机器人的最新进展。
这次,Optimus 开始进厂打工了,在特斯拉电池工厂学会了分装电池,并且比以前走得更快更远更稳了。
让我们先一睹 Optimus 的最新技能和训练细节。
现在,Optimus 的端到端神经网络经过训练,能够对特斯拉工厂的电池单元进行准确分装。
在机器人的FSD计算机上实时运行,仅仅依靠2D摄像头、手部触觉和力传感器。Optimus利用它的腿保持平衡,同时网络驱动整个上半身。
在插入过程中需要非常精确的动作,且容错率很低,神经网络会自动定位下一个空闲槽位。Optimus 还能从故障中自主恢复。
Optimus 的训练数据是通过人类远程操作收集,并针对各种任务进行了扩展。
Optimus 在工厂进行测试,人工干预率持续下降。
当然,Optimus 现在可以在定期绕着办公室行走,不仅走得更快,走的距离也越来越远了。
对此,特斯拉 Optimus(Tesla Bot)工程师 Milan Kovac 对 Optimus 的更多训练细节进行了解读。
在过去的几个月里,特斯拉出色的制造团队制造出了更多的机器人,以便进行研究并收集人工智能数据。
团队训练并部署了一个神经网络,允许 Optimus 开始执行有用的任务,例如从传送带上捡起电池单元并将它们精确地插入托盘中。
这个神经网络完全端到端运行,这意味着 Optimus 只消耗来自机器人 2D 摄像头的视频以及板载本体感受器上的数据,并直接产生关节控制序列。
Optimus 完全在机器人的嵌入式 FSD 计算机上运行,由板载电池供电。这样的设计使得单个神经网络可以通过添加更多样化的数据到训练过程中来执行多个任务。
虽然目前 Optimus 还不完美,速度还有点慢,但我们看到了越来越高的成功率和越来越少的失误。特斯拉还训练 Optimus 从失败案例中恢复,并看到了自发的校正发生。
特斯拉已经在一家工厂部署了几台 Optimus 人形机器人,它们每天都在真实的工作站上进行测试,并持续改进。
团队正在进行进一步的工作,以使 Optimus 移动更快,以及应对更恶劣的地形,同时不牺牲它的人性化特性。团队还将专注于可重复性、训练神经网络处理动态校准和机器人之间的微小差异。很快会有更多的更新。
此外,英伟达高级研究科学家、AI Agents 负责人 Jim Fan 对 Optimus 新视频展示出的技能给予了很高的评价。
他认为,视频让我们窥见了人类数据收集的真实场景,这是 Optimus 最大的优势。建立这样的流水线需要什么呢?Optimus 做到了以下几点:
Optimus 的手是世界上顶级五指灵巧型机器人手之一,它具有触觉感知,拥有 11 个自由度(DOF),相比之下许多竞品只有 6-7 个 DOF,并且具有强大的稳健性,能够在不需要持续维护的情况下承受大量的物体交互。
远程操作软件:我们可以看到人类操作员戴着 VR 眼镜和手套。设置软件以实现第一人称视频的实时传输和精确控制输出,同时保持极低延迟,这是非常了不起的。人类对于自己动作和机器人动作之间的最微小延迟都非常敏感。Optimus 有一个流畅的全身控制器,可以实时执行人类姿态。
大规模 fleet:你需要不止一个机器人来并行收集数据,需要训练有素的人类每天进行多次轮班(最好全天候),以及一个随叫随到的维护团队,以确保机器人始终处于忙碌状态。这是学术研究实验室甚至都不会考虑的大量操作复杂性。
任务与环境:弄清楚要远程操作什么也同样重要。目前,大多数此类工作都是由演示驱动的:收集你想要放入社交媒体视频中的任务数据。但想要解决通用型机器人的问题,我们需要仔细考虑任务和环境的分布。从视频的 43 秒到 51 秒部分,我们可以看到工厂和家居环境,如移动电池、处理洗衣物、将日常物品分类放入货架。
这是一个开放性的研究问题:如果你只有预算来收集 1000 个任务的训练数据,你会选择什么来最大化技能转移和泛化呢?
结论:远程操作是解决人形机器人问题的必要条件,但不足以充分解决问题。它从根本上来说无法扩展。
在评论区,马斯克预告了 Optimus 人形机器人手部的最新目标,在今年晚些时候将拥有 22 自由度(DoF)。这就更让人期待一波了。
此前,据马斯克在财报电话会议上透露,特斯拉 Optimus 人形机器人可能会在今年底拥有完成「有用的工厂任务」的能力,并计划今年底前在自家工厂率先使用。同时特斯拉有可能在 2025 年年底前对外销售 Optimus。
特斯拉人形机器人「进化史」
特斯拉人形机器人最早要追溯到 2021 年 8 月的「特斯拉 AI 日」活动上,当时马斯克首次透露了要造人形机器人(Tesla Bot)的设想。
这款人形机器人的身高大概是 1.72 米,重约 112 斤,身材匀称,还带有一张面部屏幕,能够以约 8 公里 / 小时的速度移动。
2022 年 10 月,这一年的「特斯拉 AI 日」上,Optimus 人形机器人首次亮相。彼时,它还不能做跳舞等花样表演。机器人工作时的功耗是 500W,重量达到 73 公斤,手运动的自由度有 27 个。
不过,在 Demo 演示中,Optimus 展示了其搬箱子、浇花、在特斯拉超级工厂工作的画面。
2023 年 5 月,经过半年多的蛰伏,特斯拉 Optimus 终于具备了流畅行走和抓取物体的能力。
2023 年 9 月,特斯拉 Optimus 再次进化,可以自主对物体进行分类了,亮点在于神经网络完全端到端训练:输入视频、输出控制。闲暇之余,它还能做瑜伽消遣。
2023 年 12 月,Optimus 二代到来,让人的确看到了电影《机械公敌》里的样子了。
随着新视频的发布,特斯拉人形机器人的进步速度再次令人惊叹。
以上是特斯拉Optimus人形机器人进厂打工,娴熟分装电池、自我矫正,还能走更远了的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

热门话题

本站6月27日消息,剪映是由字节跳动旗下脸萌科技开发的一款视频剪辑软件,依托于抖音平台且基本面向该平台用户制作短视频内容,并兼容iOS、安卓、Windows、MacOS等操作系统。剪映官方宣布会员体系升级,推出全新SVIP,包含多种AI黑科技,例如智能翻译、智能划重点、智能包装、数字人合成等。价格方面,剪映SVIP月费79元,年费599元(本站注:折合每月49.9元),连续包月则为59元每月,连续包年为499元每年(折合每月41.6元)。此外,剪映官方还表示,为提升用户体验,向已订阅了原版VIP

通过将检索增强生成和语义记忆纳入AI编码助手,提升开发人员的生产力、效率和准确性。译自EnhancingAICodingAssistantswithContextUsingRAGandSEM-RAG,作者JanakiramMSV。虽然基本AI编程助手自然有帮助,但由于依赖对软件语言和编写软件最常见模式的总体理解,因此常常无法提供最相关和正确的代码建议。这些编码助手生成的代码适合解决他们负责解决的问题,但通常不符合各个团队的编码标准、惯例和风格。这通常会导致需要修改或完善其建议,以便将代码接受到应

想了解更多AIGC的内容,请访问:51CTOAI.x社区https://www.51cto.com/aigc/译者|晶颜审校|重楼不同于互联网上随处可见的传统问题库,这些问题需要跳出常规思维。大语言模型(LLM)在数据科学、生成式人工智能(GenAI)和人工智能领域越来越重要。这些复杂的算法提升了人类的技能,并在诸多行业中推动了效率和创新性的提升,成为企业保持竞争力的关键。LLM的应用范围非常广泛,它可以用于自然语言处理、文本生成、语音识别和推荐系统等领域。通过学习大量的数据,LLM能够生成文本

大型语言模型(LLM)是在巨大的文本数据库上训练的,在那里它们获得了大量的实际知识。这些知识嵌入到它们的参数中,然后可以在需要时使用。这些模型的知识在训练结束时被“具体化”。在预训练结束时,模型实际上停止学习。对模型进行对齐或进行指令调优,让模型学习如何充分利用这些知识,以及如何更自然地响应用户的问题。但是有时模型知识是不够的,尽管模型可以通过RAG访问外部内容,但通过微调使用模型适应新的领域被认为是有益的。这种微调是使用人工标注者或其他llm创建的输入进行的,模型会遇到额外的实际知识并将其整合

7月4日下午,由世界人工智能大会组委会办公室指导,世界人工智能大会组委会办公室主办,国家地方共建人形机器人创新中心、中国电子学会承办,本站、《机器人技术与应用》杂志协办的2024WAIC世界人工智能大会人形机器人与具身智能发展论坛将于7月4日下午在上海世博展览馆举行。本次论坛邀请了12位国内外人形机器人与具身智能领域的学者、企业代表以及开发者代表进行了主旨报告、技术分享和圆桌讨论,并发布了人形机器人创新成果。论坛现场吸引了200多位人形机器人及具身智能领域的专业观众,同时通过多个直播平台在线观看

黄仁勋表示:「AI的下一波浪潮是机器人,其中最令人兴奋的发展之一是人形机器人。」如今,ProjectGR00T又迈出了重要的一步。昨日,英伟达创始人黄仁勋在SIGGRAPH2024Keynote演讲中讲到了其人形机器人通用基础模型「ProjectGR00T」。该模型在功能上迎来了一系列更新。德克萨斯大学奥斯汀分校助理教授、英伟达高级研究科学家朱玉可发推,在视频中演示了英伟达如何将通用家务机器人大规模仿真训练框架RoboCasa和MimicGen系统整合到英伟达Omniverse平台和Isaac机

编辑|ScienceAI问答(QA)数据集在推动自然语言处理(NLP)研究发挥着至关重要的作用。高质量QA数据集不仅可以用于微调模型,也可以有效评估大语言模型(LLM)的能力,尤其是针对科学知识的理解和推理能力。尽管当前已有许多科学QA数据集,涵盖了医学、化学、生物等领域,但这些数据集仍存在一些不足。其一,数据形式较为单一,大多数为多项选择题(multiple-choicequestions),它们易于进行评估,但限制了模型的答案选择范围,无法充分测试模型的科学问题解答能力。相比之下,开放式问答

机器学习是人工智能的重要分支,它赋予计算机从数据中学习的能力,并能够在无需明确编程的情况下改进自身能力。机器学习在各个领域都有着广泛的应用,从图像识别和自然语言处理到推荐系统和欺诈检测,它正在改变我们的生活方式。机器学习领域存在着多种不同的方法和理论,其中最具影响力的五种方法被称为“机器学习五大派”。这五大派分别为符号派、联结派、进化派、贝叶斯派和类推学派。1.符号学派符号学(Symbolism),又称为符号主义,强调利用符号进行逻辑推理和表达知识。该学派认为学习是一种逆向演绎的过程,通过已有的
