Meta研究人员做出AI新尝试：教机器人无需地图或训练实现物理导航-人工智能-PHP中文网

首页

科技周边

人工智能

Meta研究人员做出AI新尝试：教机器人无需地图或训练实现物理导航

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Apr 09, 2023 pm 08:31 PM

人工智能 ai模型 meta

Meta Platforms公司人工智能部门日前表示，他们正在教AI模型如何在少量训练数据支持下学会在物理世界中行走，目前已经取得了快速进展。

这项研究能够显著缩短AI模型获得视觉导航能力的时间。以前，实现这类目标要需要利用大量数据集配合重复“强化学习”才能实现。

Meta AI研究人员表示，这项关于AI视觉导航的探索将给虚拟世界带来重大影响。而项目的基本思路并不复杂：帮助AI像人类那样，单纯通过观察和探索实现在物理空间导航。

Meta AI部门解释道，“比如，如果要让AR眼镜指引我们找到钥匙，就必须想办法帮助AI理解陌生的、不断变化的环境布局。毕竟这是非常细化的小需求，不可能永远依赖于极占算力资源的高精度预置地图。人类不需要了解咖啡桌的确切位置或长度就能不产生任何碰撞、轻松绕着桌角走动。”

为此，Meta决定将精力集中在“具身AI”身上，即通过3D模拟中的交互机制训练AI系统。在这一领域，Meta表示已经建立起一套值得期待的“点目标导航模型”，无需任何地图或GPS传感器即可在新环境中导航。

该模型使用一种名为视觉测量的技术，允许AI根据视觉输入跟踪自身当前位置。Meta表示，这项数据增强技术能够快速训练出有效的神经模型，且无需人工数据注释。Meta还提到，他们已经在自家Habitat 2.0具身AI训练平台（利用Realistic PointNav基准任务运行虚拟空间模拟）上完成了测试，成功率达到94%。

Meta研究人员做出AI新尝试：教机器人无需地图或训练实现物理导航

Meta方面解释道，“虽然我们的方法还没有完全解决数据集中的所有场景，但这项研究已经初步证明，现实环境的导航能力不一定需要显式映射来实现。”

为了在不依赖地图的情况下进一步完善AI导航训练，Meta建立了一套名为Habitat-Web的训练数据集，其中包含10万多种由人类演示的不同对象-目标导航方法。通过运行在网络浏览器上的Habitat模拟器就能顺利接入Amazon.com的Mechanical Turk服务，用户能够以远程方式安全操作虚拟机器人。Meta表示，由此产生的数据将作为训练素材，帮助AI代理获得“最先进的结果”。扫视房间了解整体空间特点、检查角落是否有障碍物等，都是值得AI向人类学习的高效对象搜索行为。

此外，Meta AI团队还开发出所谓“即插即用”模块化方法，可以通过一套独特的“零样本体验学习框架”帮助机器人在多种语义导航任务和目标模式中实现泛化。通过这种方式，AI代理在缺少资源密集型地图和训练的前提下仍可获得基本导航技能，无需额外调整即可在3D环境中执行不同任务。

Meta研究人员做出AI新尝试：教机器人无需地图或训练实现物理导航

Meta公司解释道，这些代理在训练中会不断搜索图像目标。它们会收到一张在环境中随机位置拍摄的照片，然后通过自主导航尝试找到拍摄点位。Meta研究人员们表示，“我们的方法将训练数据削减至1/12.5，成功率则比最新的迁移学习技术还高出14%。”

Constellation Research公司分析师Holger Mueller在采访中表示，Meta的这项最新进展有望在其元宇宙发展计划中发挥关键作用。他认为，如果未来虚拟世界能够成为常态，那AI必须有能力理解这个新空间，而且理解的成本还不能太高。

Mueller补充道，“AI理解物理世界的能力需要由基于软件的方法获得扩展。Meta目前走的就是这条路，而且在具身AI方面取得了进步，开发出无需训练即可自主理解周边环境的软件。我很期待看到这方面成果在实践层面的早期应用。”

这些现实用例可能已经离我们不远了。Meta公司表示，下一步计划就是把这些成果从导航推进到移动操作，开发出能够执行特定任务的AI代理（比如识别出钱包并将其交还给主人）。

以上是Meta研究人员做出AI新尝试：教机器人无需地图或训练实现物理导航的详细内容。更多信息请关注PHP中文网其他相关文章！

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

热AI工具

Undresser.AI Undress

人工智能驱动的应用程序，用于创建逼真的裸体照片

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

免费脱衣服图片

Clothoff.io

AI脱衣机

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸！

显示更多

热工具

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

中文版，非常好用

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

显示更多

热门话题

gmail邮箱登陆入口在哪里

7675

CakePHP 教程

1393

C# 教程

1207

steam的账户名称是什么格式

win11激活密钥永久

显示更多

Related knowledge

字节跳动剪映推出 SVIP 超级会员：连续包年 499 元，提供多种 AI 功能 Jun 28, 2024 am 03:51 AM

本站6月27日消息，剪映是由字节跳动旗下脸萌科技开发的一款视频剪辑软件，依托于抖音平台且基本面向该平台用户制作短视频内容，并兼容iOS、安卓、Windows、MacOS等操作系统。剪映官方宣布会员体系升级，推出全新SVIP，包含多种AI黑科技，例如智能翻译、智能划重点、智能包装、数字人合成等。价格方面，剪映SVIP月费79元，年费599元（本站注：折合每月49.9元），连续包月则为59元每月，连续包年为499元每年（折合每月41.6元）。此外，剪映官方还表示，为提升用户体验，向已订阅了原版VIP

使用Rag和Sem-Rag提供上下文增强AI编码助手 Jun 10, 2024 am 11:08 AM

通过将检索增强生成和语义记忆纳入AI编码助手，提升开发人员的生产力、效率和准确性。译自EnhancingAICodingAssistantswithContextUsingRAGandSEM-RAG，作者JanakiramMSV。虽然基本AI编程助手自然有帮助，但由于依赖对软件语言和编写软件最常见模式的总体理解，因此常常无法提供最相关和正确的代码建议。这些编码助手生成的代码适合解决他们负责解决的问题，但通常不符合各个团队的编码标准、惯例和风格。这通常会导致需要修改或完善其建议，以便将代码接受到应

微调真的能让LLM学到新东西吗:引入新知识可能让模型产生更多的幻觉 Jun 11, 2024 pm 03:57 PM

大型语言模型（LLM）是在巨大的文本数据库上训练的，在那里它们获得了大量的实际知识。这些知识嵌入到它们的参数中，然后可以在需要时使用。这些模型的知识在训练结束时被“具体化”。在预训练结束时，模型实际上停止学习。对模型进行对齐或进行指令调优，让模型学习如何充分利用这些知识，以及如何更自然地响应用户的问题。但是有时模型知识是不够的，尽管模型可以通过RAG访问外部内容，但通过微调使用模型适应新的领域被认为是有益的。这种微调是使用人工标注者或其他llm创建的输入进行的，模型会遇到额外的实际知识并将其整合

新款经济实惠的 Meta Quest 3S VR 耳机出现在 FCC 上，暗示即将推出 Sep 04, 2024 am 06:51 AM

Meta Connect 2024 活动定于 9 月 25 日至 26 日举行，在本次活动中，该公司预计将推出一款价格实惠的新型虚拟现实耳机。据传这款 VR 耳机是 Meta Quest 3S，它似乎已经出现在 FCC 清单上。这个建议

首个超越GPT4o级开源模型！Llama 3.1泄密：4050亿参数，下载链接、模型卡都有了 Jul 23, 2024 pm 08:51 PM

快准备好你的GPU！Llama3.1终于现身了，不过出处却不是Meta官方。今日，Reddit上新版Llama大模型泄露的消息遭到了疯传，除了基础模型，还包括8B、70B和最大参数的405B的基准测试结果。下图为Llama3.1各版本与OpenAIGPT-4o、Llama38B/70B的比较结果。可以看到，即使是70B的版本，也在多项基准上超过了GPT-4o。图源：https://x.com/mattshumer_/status/1815444612414087294显然，3.1版本的8B和70

为大模型提供全新科学复杂问答基准与测评体系，UNSW、阿贡、芝加哥大学等多家机构联合推出SciQAG框架 Jul 25, 2024 am 06:42 AM

编辑|ScienceAI问答（QA）数据集在推动自然语言处理（NLP）研究发挥着至关重要的作用。高质量QA数据集不仅可以用于微调模型，也可以有效评估大语言模型（LLM）的能力，尤其是针对科学知识的理解和推理能力。尽管当前已有许多科学QA数据集，涵盖了医学、化学、生物等领域，但这些数据集仍存在一些不足。其一，数据形式较为单一，大多数为多项选择题（multiple-choicequestions），它们易于进行评估，但限制了模型的答案选择范围，无法充分测试模型的科学问题解答能力。相比之下，开放式问答

最强模型Llama 3.1 405B正式发布，扎克伯格：开源引领新时代 Jul 24, 2024 pm 08:23 PM

刚刚，大家期待已久的Llama3.1官方正式发布了！Meta官方发出了「开源引领新时代」的声音。在官方博客中，Meta表示：「直到今天，开源大语言模型在功能和性能方面大多落后于封闭模型。现在，我们正在迎来一个开源引领的新时代。我们公开发布MetaLlama3.1405B，我们认为这是世界上最大、功能最强大的开源基础模型。迄今为止，所有Llama版本的总下载量已超过3亿次，我们才刚刚开始。」Meta创始人、CEO扎克伯格也亲自写了篇长文《OpenSourceAIIsthePathForward》，