社区

学习

工具库

AI工具

休闲

简体中文

首页 > 科技周边 > 人工智能 > OpenAI大模型上身机器人，原速演示炸场！

OpenAI大模型上身机器人，原速演示炸场！

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

发布： 2024-03-15 09:37:23

转载

557 人浏览过

OpenAI大模型加持的机器人，深夜来袭！

名曰Figure 01，它能听会说，动作灵活。

OpenAI大模型上身机器人，原速演示炸场！

能和人类描述眼前看到的一切：

我在桌子上看到一个红色的苹果，沥水架上还摆放着几个盘子和一个杯子；你站在旁边，双手轻轻放在桌子上。

OpenAI大模型上身机器人，原速演示炸场！图片

听到人类说“想吃东西”，就马上递过去苹果。

OpenAI大模型上身机器人，原速演示炸场！图片

而且对于自己做的事有清楚认知，给苹果是因为这是桌上唯一能吃的东西。

还顺便把东西整理，能同时搞定两种任务。

OpenAI大模型上身机器人，原速演示炸场！图片

最关键的是，这些展示都没有加速，机器人本来的动作就这么迅速。

（也没人在后面操纵）

OpenAI大模型上身机器人，原速演示炸场！

这下网友坐不住了，立马@波士顿动力：

老伙计们，这家伙是真来劲儿了。咱得回实验室，让以前的机器人（波士顿动力）多跳点舞了。

OpenAI大模型上身机器人，原速演示炸场！图片

也有网友看在OpenAI卷完大语言模型、文生视频之后，又狙击机器人后感慨道：

这是一场激烈的竞争；与OpenAl合作，苹果可能会超越特斯拉。

但硬件方面，擎天柱看起来更美观，Figure 01仍然需要一些“整容手术”。（doge）

OpenAI大模型上身机器人，原速演示炸场！图片

接下来，我们继续来看下Figure 01的细节。

OpenAI视觉语言大模型加持

根据创始人的介绍，Figure 01通过端到端神经网络，可以和人类自如对话。

基于OpenAI提供的视觉理解和语言理解能力，它能完成快速、简单、灵巧的动作。

模型只说是一个视觉语言大模型，是否为GPT-4V不得而知。

OpenAI大模型上身机器人，原速演示炸场！图片

它还能规划动作、有短期记忆能力、用语言解释它的推理过程。

OpenAI大模型上身机器人，原速演示炸场！图片

比如对话里说“你能把它们放在那里吗？”

“它们”、“那里”这种模糊表述的理解，就体现了机器人的短期记忆能力。

它使用了OpenAI训练的视觉语言模型，机器人摄像头会以10Hz拍下画面，然后神经网络将以200Hz输出24自由度动作（手腕+手指关节角度）。

具体分工上，机器人的策略也很像人类。

复杂动作交给AI大模型，预训练模型会对图像和文本进行常识推理，给出动作计划；

简单动作如抓起塑料袋（抓哪里都可以），机器人基于已学习的视觉-动作执行策略，可以做出一些“下意识”的快速反应行动。

同时全身控制器会负责保持机身平衡、运动稳定。

OpenAI大模型上身机器人，原速演示炸场！图片

机器人的语音能力则基于一个文本-语音大模型微调而来。

OpenAI大模型上身机器人，原速演示炸场！图片

除了最先进的AI模型，Figure 01背后公司——Figure的创始人兼CEO还在推文中提到，Figure方面整合了机器人的所有关键组成。

包括电机、中间件操作系统、传感器、机械结构等，均由Figure工程师设计。

据了解，这家机器人初创公司在2周前才正式宣布和OpenAI的合作，但才13天后就带来如此重磅成果。不少人都开始期待后续合作了。

OpenAI大模型上身机器人，原速演示炸场！图片

由此，具身智能领域又有一颗新星走到了聚光灯下。

“将人形机器人带进生活”

说到Figure，这家公司创立于2022年，正如前文所言，再次引爆外界关注，就在十几天前——

官宣在新一轮融资中筹集6.75亿美元，估值冲到26亿美元，投资方几乎要集齐半个硅谷，包括微软、OpenAI、英伟达和亚马逊创始人贝佐斯等等。

更重要的是，OpenAI同时公开了与Figure更进一步合作的计划：将多模态大模型的能力扩展到机器人的感知、推理和交互上，“开发能够取代人类进行体力劳动的人形机器人”。

用现在最热的科技词汇来说，就是要一起搞具身智能。

OpenAI大模型上身机器人，原速演示炸场！图片

彼时，Figure 01的最新进展是酱婶的：

通过观看人类的示范视频，仅需10小时端到端训练，Figure 01就能学会用胶囊咖啡机泡咖啡。

OpenAI大模型上身机器人，原速演示炸场！图片

Figure与OpenAI的合作一公开，网友们就已经对未来的突破充满了期待。

OpenAI大模型上身机器人，原速演示炸场！图片

毕竟Brett Adcock，可是把“唯一的重点是以30年的视角建立Figure，以积极影响人类的未来”这样的话都写在个人主页上了。

但可能没人能想得到，仅仅两周左右的时间，新进展就来了。

如此之快，如此之远。并且还能持续泛化、扩展规模。

OpenAI大模型上身机器人，原速演示炸场！图片

值得一提的是，与炸场demo同时发布的，还有Figure的招聘信息：

我们正在将人形机器人带进生活。加入我们。

OpenAI大模型上身机器人，原速演示炸场！图片

参考链接：
[1]https://www.php.cn/link/59bbfbe0d3922ccd1d167661a26d8353
[2]https://www.php.cn/link/a3fc34dce15cda93287496c84af5203c
[3]https://www.php.cn/link/194585b5215aea447389c5fefca09c61

以上是OpenAI大模型上身机器人，原速演示炸场！的详细内容。更多信息请关注PHP中文网其他相关文章！

相关标签：

机器人 openai 模型

来源：51cto.com

上一篇：Meta新增两大万卡集群，投入近50000块英伟达H100 GPU 下一篇：到2028年，人工智能视频分析市场将达到690亿美元

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

什么是 NullPointerException，如何修复它？

2024-10-22 09:46:29
从新手到程序员：您的旅程从 C 基础知识开始

2024-10-13 13:53:41
使用PHP解锁网络开发：初学者指南

2024-10-12 12:15:51
揭秘 C：为新程序员提供一条清晰简单的道路

2024-10-11 22:47:31
释放您的编码潜力：绝对初学者的 C 编程

2024-10-11 19:36:51
释放你内心的程序员：C 绝对初学者

2024-10-11 15:50:41
使用 C 自动化您的生活：适合初学者的脚本和工具

2024-10-11 15:07:41
PHP 变得简单：Web 开发的第一步

2024-10-11 14:21:21
使用 Python 构建任何东西：释放创造力的初学者指南

2024-10-11 12:59:11
编码的关键：为初学者释放 Python 的力量

2024-10-11 12:17:31

最新问题

javascript - autodesk forge viewer 多模型加载模型浏览器问题

来自于 1970-01-01 08:00:00

0

0

0

关于模型的问题

来自于 1970-01-01 08:00:00

0

0

0

模型不收敛是怎么回事？

来自于 1970-01-01 08:00:00

0

0

0

Laravel关联模型的问题

来自于 1970-01-01 08:00:00

0

0

0

Laravel - 将模型关系更新到另一个模型

来自于 1970-01-01 08:00:00

0

0

0

相关专题

更多>

热门推荐

热门教程

更多>

相关教程

热门推荐

最新课程

最新ThinkPHP 5.1全球首发视频教程(60天成就PHP大牛线上培训班课)

1430896
php入门教程之一周学会PHP

4284522
JAVA 初级入门视频教程

2606608
小甲鱼零基础入门学习Python视频教程

512652
PHP 零基础入门教程

871276

最新下载

更多>

网站特效

网站源码

网站素材

前端模板