首頁 科技週邊 人工智慧 谷歌旗下 DeepMind 開發出 RoboCat AI 模型,能控制多種機器人執行一系列任務

谷歌旗下 DeepMind 開發出 RoboCat AI 模型,能控制多種機器人執行一系列任務

Jun 26, 2023 pm 04:07 PM
ai 模型 gato

谷歌旗下 DeepMind 开发出 RoboCat AI 模型,能控制多种机器人执行一系列任务

6 月 26 日訊息,Google旗下 DeepMind 表示,該公司已經開發出一種名為 RoboCat 的人工智慧模型,可以控制不同的機器手臂執行一系列任務。僅僅這一點並不特別新穎,但 DeepMind 聲稱,該模型是第一個能夠解決和適應多種任務的模型,並且使用不同的、真實世界的機器人來完成。

谷歌旗下 DeepMind 开发出 RoboCat AI 模型,能控制多种机器人执行一系列任务

RoboCat 的靈感來自 DeepMind 的另一個 AI 模型 Gato,後者可以分析和處理文字、圖像和事件。 RoboCat 的訓練數據包括模擬和真實機器人的圖像和動作數據,這些數據來自於虛擬環境中的其他機器人控制模型、人類控制的機器人以及 RoboCat 自身的前期版本。

DeepMind 的研究科學家李亞歷克斯(Alex Lee)是RoboCat 團隊的合作者之一,他在接受TechCrunch 郵件採訪時說:「我們證明了一個單一的大型模型可以在多個真實的機器人實體上解決多樣化的任務,並且可以快速地適應新的任務和實體。」

IT之家注意到,為了訓練RoboCat,DeepMind 的研究人員首先使用人類控制的機械臂,在模擬或真實環境中收集了每個任務或機器人的100 到1000 次演示。例如,讓機械手臂拾取齒輪或堆疊積木等。然後,他們對 RoboCat 進行微調,在每個任務上創建一個專門的「衍生」模型,讓它平均練習 10000 次。透過利用衍生模型產生的數據和演示數據,研究人員不斷擴大 RoboCat 的訓練數據集,並訓練出新版本的 RoboCat。

最終版本的 RoboCat 在模擬和真實世界中,在總共 253 個任務上進行了訓練,並在這些任務的 141 個變體上進行了測試。 DeepMind 聲稱,在觀察了幾個小時內收集的 1000 次人類控制的演示後,RoboCat 學會了操作不同類型的機械手臂。雖然 RoboCat 已經在四種有兩爪臂的機器人上進行了訓練,但該模型能夠適應一種更複雜的有三指夾具和兩倍可控輸入的機械臂。

儘管如此,RoboCat 在 DeepMind 的測試中,在不同任務上的成功率也有很大差異,從最低的 13% 到最高的 99% 不等。這是在訓練資料中有 1000 次演示的情況下;如果演示次數減半,成功率也會相應降低。不過,在某些情況下,DeepMind 聲稱 RoboCat 只需要觀察 100 次演示就能學習新任務。

李亞歷克斯認為,RoboCat 可能會降低解決新任務的難度。 「只要給出一定數量的新任務演示,RoboCat 就可以微調到新任務,並且可以自我生成更多數據來進一步提高。」他補充說。

未來,研究團隊的目標是減少教導 RoboCat 完成新任務所需的演示次數,使其少於 10 次。

以上是谷歌旗下 DeepMind 開發出 RoboCat AI 模型,能控制多種機器人執行一系列任務的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

Flash Attention穩定嗎? Meta、哈佛發現其模型權重偏差呈現數量級波動 Flash Attention穩定嗎? Meta、哈佛發現其模型權重偏差呈現數量級波動 May 30, 2024 pm 01:24 PM

MetaFAIR聯合哈佛優化大規模機器學習時所產生的資料偏差,提供了新的研究架構。據所周知,大語言模型的訓練常常需要數月的時間,使用數百甚至上千個GPU。以LLaMA270B模型為例,其訓練總共需要1,720,320個GPU小時。由於這些工作負載的規模和複雜性,導致訓練大模型存在著獨特的系統性挑戰。最近,許多機構在訓練SOTA生成式AI模型時報告了訓練過程中的不穩定情況,它們通常以損失尖峰的形式出現,例如Google的PaLM模型訓練過程中出現了多達20次的損失尖峰。數值偏差是造成這種訓練不準確性的根因,

微軟推出 XOT 技術,加強語言模式的推理能力 微軟推出 XOT 技術,加強語言模式的推理能力 Nov 17, 2023 pm 05:45 PM

11月15日消息,微軟近日推出了名為「EverythingofThought」(XOT)的方法,靈感來自GoogleDeepMind的AlphaZero,利用緊湊的神經網絡,來增強AI模型推理能力。微軟和喬治亞理工學院、華東師範大學合作開發了該演算法,整合了強化學習(reinforcementlearning)和蒙特卡羅樹搜尋(MCTS)能力,在複雜決策環境中,進一步提高解決問題的有效性。本站注意:微軟研究團隊表示,XOT方法可以使語言模型在不熟悉的問題上擴展,在Gameof24、8-Puzzle和P

TPC 聯盟成立:目標數兆以上參數 AI 模型,推進科學發現 TPC 聯盟成立:目標數兆以上參數 AI 模型,推進科學發現 Nov 18, 2023 pm 07:29 PM

11月16日消息,業界領先的科研機構、美國國家超級計算中心和諸多AI領域龍頭公司,近日聯合組建了萬億參數聯盟(TrillionParameterConsortium,簡稱TPC)。由DALL-E3生成根據報道,本站獲悉,TPC聯盟由全球各實驗室、科研機構、學術界和工業界的科學家組成,旨在共同推進用於科學發現的人工智能模型,並特別關注擁有一兆或更多參數的巨型模型TPC聯盟目前正致力於開發可擴展的模型架構和訓練策略,同時組織和整理用於模型訓練的科學數據,以優化AI庫在當前和未來的百萬兆次級運算平台

谷歌旗下 DeepMind 開發出 RoboCat AI 模型,能控制多種機器人執行一系列任務 谷歌旗下 DeepMind 開發出 RoboCat AI 模型,能控制多種機器人執行一系列任務 Jun 26, 2023 pm 04:07 PM

6月26日消息,Google旗下DeepMind表示,該公司已經開發出一種名為RoboCat的人工智慧模型,可以控制不同的機器人手臂執行一系列任務。僅僅這一點並不特別新穎,但DeepMind聲稱,該模型是第一個能夠解決和適應多種任務的模型,並且使用不同的、真實世界的機器人來完成。 RoboCat的靈感來自DeepMind的另一個AI模型Gato,後者可以分析和處理文字、圖像和事件。 RoboCat的訓練數據包括模擬和真實機器人的圖像和動作數據,這些數據來自於虛擬環境中的其他機器人控制模型、人類控制的機器人

Databricks 發佈大數據分析平台 Spark 使用 AI 模型 SDK:一鍵產生 SQL 與 FySpark 語言圖表程式碼 Databricks 發佈大數據分析平台 Spark 使用 AI 模型 SDK:一鍵產生 SQL 與 FySpark 語言圖表程式碼 Jul 17, 2023 pm 05:53 PM

7月10日訊息,Databricks日前發布大數據分析平台Spark所使用的AI模型SDK,開發者寫程式碼時,可用英文下指令,編譯器就會將英文指令轉換為PySpark或SQL語言程式碼,以提升開發者效率。 ▲圖來源Databricks網站據悉,Spark是一款開源大數據分析工具,每年超過10億次下載、在全球208個國家和地區使用。 ▲圖來源Databricks網站Databricks表示,微軟的AI程式助理GitHubCopilot固然強大,但使用門檻也相當高,Databricks的SDK相對較具普適性,更容易

Google DeepMind 公佈的「FunSearch」訓練法:讓 AI 模型能夠解決複雜離散數學問題 Google DeepMind 公佈的「FunSearch」訓練法:讓 AI 模型能夠解決複雜離散數學問題 Dec 17, 2023 pm 08:15 PM

12月15日消息,GoogleDeepMind日前公佈了一種名為「FunSearch」的模型訓練法,號稱能夠計算包含「上限級問題」、「裝箱問題」在內的一系列「涉及數學、電腦科學領域的複雜問題」。需要進行改寫的內容是:▲圖來源:GoogleDeepMind(以下簡稱DeepMind)據悉,FunSearch模型訓練法主要為AI模型引入了一個「評估器(Evaluator)」系統,AI模型輸出一系列「創意解題方法”,“評估器”則負責評判模型輸出的解題辦法,反覆迭代後,就能訓練出數學能力更強的AI模型。谷歌的DeepM

微軟發布最新 AI 服務條款:禁止反向工程等活動 微軟發布最新 AI 服務條款:禁止反向工程等活動 Aug 16, 2023 pm 05:53 PM

微軟於8月16日公佈了其AI服務條款,並宣布該條款將於9月30日生效。這次更新的主要內容是針對生成式AI,特別是與相關用戶的使用以及負責任的開發實踐相關的內容微軟強調官方不會保留用戶與必應聊天的對話記錄,也不會將這些聊天數據用於訓練BingEnterpriseChat的AI模型這五個關鍵政策要點涵蓋了多個領域,包括禁止使用者試圖對AI模型進行逆向工程以防止揭示底層組件;除非明確允許,否則禁止透過Web抓取等方式提取資料;一項重要條款限制使用者使用AI資料來建立或增強其他AI服務以下是微軟新增的條款內

微軟推出 LLaVA-Med AI 模型,可對醫學病理案例進行分析 微軟推出 LLaVA-Med AI 模型,可對醫學病理案例進行分析 Jun 15, 2023 pm 03:06 PM

6月14日消息,日前微軟研究人員展示了LLaVA-Med模型,該模型主要用於生物醫學方面的研究,可根據CT、X光圖片等推測出患者的病理狀況。據悉,微軟研究人員與一群醫院合作,獲得了使用生物醫學影像文字對應大型資料集來訓練多模態AI模型。此資料集包括胸部X光、MRI、組織學、病理學和CT影像等,覆蓋範圍相對全面。 ▲圖來源微軟微軟使用GPT-4,基於VisionTransformer和Vicuna語言模型,在八個英偉達A100GPU上對LLaVA-Med進行訓練,其中包含“每個影像的所有預分析資訊”,

See all articles