目錄
特斯拉人形機器人「進化史」
首頁 科技週邊 人工智慧 特斯拉Optimus人形機器人進廠打工,純熟分裝電池、自我矯正,還能走更遠了

特斯拉Optimus人形機器人進廠打工,純熟分裝電池、自我矯正,還能走更遠了

May 06, 2024 pm 02:52 PM
人工智慧 人形機器人 optimus

特斯拉人形機器人又解鎖了新技能!

昨日,Tesla Optimus 官方發布了新的 demo 視頻,展示了二代 Optimus 人形機器人的最新進展。

特斯拉Optimus人形機器人進廠打工,純熟分裝電池、自我矯正,還能走更遠了

這次,Optimus 開始進廠工作了,在特斯拉電池工廠學會了分裝電池,並且比以前走得更快更遠更穩了。

讓我們先一睹 Optimus 的最新技能和訓練細節。

現在,Optimus 的端對端神經網路經過訓練,能夠對特斯拉工廠的電池單元進行準確分裝。

特斯拉Optimus人形機器人進廠打工,純熟分裝電池、自我矯正,還能走更遠了

特斯拉Optimus人形機器人進廠打工,純熟分裝電池、自我矯正,還能走更遠了

在機器人的FSD電腦上即時運行,只依賴2D相機、手部觸覺和力道感測器。 Optimus利用它的腿保持平衡,同時網路驅動整個上半身。

特斯拉Optimus人形機器人進廠打工,純熟分裝電池、自我矯正,還能走更遠了

在插入過程中需要非常精確的動作,且容錯率很低,神經網路會自動定位下一個空閒插槽。 Optimus 還能從故障中自主恢復。

特斯拉Optimus人形機器人進廠打工,純熟分裝電池、自我矯正,還能走更遠了

Optimus 的訓練資料是透過人類遠端操作收集,並針對各種任務進行了擴展。

特斯拉Optimus人形機器人進廠打工,純熟分裝電池、自我矯正,還能走更遠了

Optimus 在工廠測試,人工幹預率持續下降。

特斯拉Optimus人形機器人進廠打工,純熟分裝電池、自我矯正,還能走更遠了

當然,Optimus 現在可以定期在辦公室周圍行走,不僅走得更快,走的距離也越來越遠了。

特斯拉Optimus人形機器人進廠打工,純熟分裝電池、自我矯正,還能走更遠了

對此,特斯拉 Optimus(Tesla Bot)工程師 Milan Kovac 對 Optimus 的更多訓練細節進行了解讀。

特斯拉Optimus人形機器人進廠打工,純熟分裝電池、自我矯正,還能走更遠了

在過去的幾個月裡,特斯拉出色的製造團隊製造出了更多的機器人,以便進行研究並收集人工智能數據。

團隊訓練並部署了一個神經網絡,讓 Optimus 開始執行有用的任務,例如從傳送帶上撿起電池單元並將它們精確地插入托盤中。

這個神經網路完全端到端運行,這意味著 Optimus 只消耗來自機器人 2D 攝影機的影片以及板載本體感受器上的數據,並直接產生關節控制序列。

Optimus 完全在機器人的嵌入式 FSD 電腦上運行,並由板載電池供電。這樣的設計使得單一神經網路可以透過添加更多樣化的資料到訓練過程中來執行多個任務。

雖然目前 Optimus 還不完美,速度還有點慢,但我們看到了越來越高的成功率和越來越少的失誤。特斯拉還訓練 Optimus 從失敗案例中恢復,並看到了自發性的校正發生。

特斯拉已經在一家工廠部署了幾台 Optimus 人形機器人,它們每天都在真實的工作站上進行測試,並持續改進。

團隊正在進行進一步的工作,以使 Optimus 移動更快,並應對更惡劣的地形,同時不犧牲它的人性化特性。團隊還將專注於可重複性、訓練神經網路處理動態校準和機器人之間的微小差異。很快會有更多的更新。

此外,英偉達高級研究科學家、AI Agents 負責人 Jim Fan 對 Optimus 新影片所展現的技能給予了很高的評價。

特斯拉Optimus人形機器人進廠打工,純熟分裝電池、自我矯正,還能走更遠了

他認為,影片讓我們窺見了人類資料收集的真實場景,這是 Optimus 最大的優勢。建立這樣的管線需要什麼呢? Optimus 做到了以下幾點:

Optimus 的手是世界上頂級五指靈巧型機器人手之一,它具有觸覺感知,擁有11 個自由度(DOF),相比之下許多競品只有6-7 個DOF,並且具有強大的穩健性,能夠在不需要持續維護的情況下承受大量的物件互動。

遠端操作軟體:我們可以看到人類操作員戴著 VR 眼鏡和手套。設定軟體以實現第一人稱視訊的即時傳輸和精確控制輸出,同時保持極低延遲,這是非常了不起的。人類對於自己動作和機器人動作之間的最微小延遲都非常敏感。 Optimus 有一個流暢的全身控制器,可以即時執行人類姿態。

大規模fleet:你需要不只一個機器人來並行收集數據,需要訓練有素的人類每天進行多次輪班(最好全天候),以及一個隨叫隨到的維護團隊,以確保機器人始終處於忙碌狀態。這是學術研究實驗室甚至不會考慮的大量操作複雜性。

任務與環境:弄清楚要遠端操作什麼也同樣重要。目前,大多數此類工作都是由簡報驅動的:收集你想要放入社群媒體影片中的任務資料。但想要解決通用型機器人的問題,我們需要仔細考慮任務和環境的分佈。從影片的 43 秒到 51 秒部分,我們可以看到工廠和家居環境,如行動電池、處理洗衣物、將日常物品分類放入貨架。

這是一個開放性的研究問題:如果你只有預算來收集 1000 個任務的訓練數據,你會選擇什麼來最大化技能轉移和泛化呢?

結論:遠端操作是解決人形機器人問題的必要條件,但不足以充分解決問題。它從根本上來說無法擴展。

在評論區,馬斯克預告了 Optimus 人形機器人手部的最新目標,在今年稍後將擁有 22 自由度(DoF)。這就更讓人期待一波了。

特斯拉Optimus人形機器人進廠打工,純熟分裝電池、自我矯正,還能走更遠了

先前,據馬斯克在財報電話會議上透露,特斯拉Optimus 人形機器人可能會在今年年底擁有完成「有用的工廠任務」的能力,並計畫今年底前在自家工廠率先使用。同時特斯拉有可能在 2025 年底前對外銷售 Optimus。

特斯拉人形機器人「進化史」

#特斯拉人形機器人最早要追溯到2021 年8 月的《特斯拉AI 日」活動上,當時馬斯克首次透露了要造人形機器人(Tesla Bot)的設想。

這款人形機器人的身高大概是 1.72 米,重約 112 斤,身材勻稱,還帶有一張面部屏幕,能夠以約 8 公里 / 小時的速度移動。

特斯拉Optimus人形機器人進廠打工,純熟分裝電池、自我矯正,還能走更遠了

2022 年 10 月,這一年的「特斯拉 AI 日」上,Optimus 人形機器人首次亮相。彼時,它還不能做跳舞等花式表演。機器人工作時的功耗是 500W,重量達到 73 公斤,手移動的自由度有 27 個。

特斯拉Optimus人形機器人進廠打工,純熟分裝電池、自我矯正,還能走更遠了

不過,在 Demo 演示中,Optimus 展示了其搬運箱子、澆花、在特斯拉超級工廠工作的畫面。

特斯拉Optimus人形機器人進廠打工,純熟分裝電池、自我矯正,還能走更遠了

2023 年 5 月,經過半年多的蟄伏,特斯拉 Optimus 終於具備了流暢行走和抓取物體的能力。

特斯拉Optimus人形機器人進廠打工,純熟分裝電池、自我矯正,還能走更遠了

2023 年9 月,特斯拉Optimus 再次進化,可以自主地對物體進行分類了,亮點在於神經網路完全端到端訓練:輸入視訊、輸出控制。閒暇之餘,它還能做瑜珈消遣。

特斯拉Optimus人形機器人進廠打工,純熟分裝電池、自我矯正,還能走更遠了

特斯拉Optimus人形機器人進廠打工,純熟分裝電池、自我矯正,還能走更遠了

2023 年12 月,Optimus 第二代到來,讓人的確看到了電影《機械公敵》裡的樣子了。

特斯拉Optimus人形機器人進廠打工,純熟分裝電池、自我矯正,還能走更遠了

隨著新影片的發布,特斯拉人形機器人的進步速度再次令人驚嘆。

特斯拉Optimus人形機器人進廠打工,純熟分裝電池、自我矯正,還能走更遠了

以上是特斯拉Optimus人形機器人進廠打工,純熟分裝電池、自我矯正,還能走更遠了的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

位元組跳動剪映推出 SVIP 超級會員:連續包年 499 元,提供多種 AI 功能 位元組跳動剪映推出 SVIP 超級會員:連續包年 499 元,提供多種 AI 功能 Jun 28, 2024 am 03:51 AM

本站6月27日訊息,剪映是由位元組跳動旗下臉萌科技開發的一款影片剪輯軟體,依託於抖音平台且基本面向該平台用戶製作短影片內容,並相容於iOS、安卓、Windows 、MacOS等作業系統。剪映官方宣布會員體系升級,推出全新SVIP,包含多種AI黑科技,例如智慧翻譯、智慧劃重點、智慧包裝、數位人合成等。價格方面,剪映SVIP月費79元,年費599元(本站註:折合每月49.9元),連續包月則為59元每月,連續包年為499元每年(折合每月41.6元) 。此外,剪映官方也表示,為提升用戶體驗,向已訂閱了原版VIP

使用Rag和Sem-Rag提供上下文增強AI編碼助手 使用Rag和Sem-Rag提供上下文增強AI編碼助手 Jun 10, 2024 am 11:08 AM

透過將檢索增強生成和語意記憶納入AI編碼助手,提升開發人員的生產力、效率和準確性。譯自EnhancingAICodingAssistantswithContextUsingRAGandSEM-RAG,作者JanakiramMSV。雖然基本AI程式設計助理自然有幫助,但由於依賴對軟體語言和編寫軟體最常見模式的整體理解,因此常常無法提供最相關和正確的程式碼建議。這些編碼助手產生的代碼適合解決他們負責解決的問題,但通常不符合各個團隊的編碼標準、慣例和風格。這通常會導致需要修改或完善其建議,以便將程式碼接受到應

七個很酷的GenAI & LLM技術性面試問題 七個很酷的GenAI & LLM技術性面試問題 Jun 07, 2024 am 10:06 AM

想了解更多AIGC的內容,請造訪:51CTOAI.x社群https://www.51cto.com/aigc/譯者|晶顏審校|重樓不同於網路上隨處可見的傳統問題庫,這些問題需要跳脫常規思維。大語言模型(LLM)在數據科學、生成式人工智慧(GenAI)和人工智慧領域越來越重要。這些複雜的演算法提升了人類的技能,並在許多產業中推動了效率和創新性的提升,成為企業保持競爭力的關鍵。 LLM的應用範圍非常廣泛,它可以用於自然語言處理、文字生成、語音辨識和推薦系統等領域。透過學習大量的數據,LLM能夠產生文本

微調真的能讓LLM學到新東西嗎:引入新知識可能讓模型產生更多的幻覺 微調真的能讓LLM學到新東西嗎:引入新知識可能讓模型產生更多的幻覺 Jun 11, 2024 pm 03:57 PM

大型語言模型(LLM)是在龐大的文字資料庫上訓練的,在那裡它們獲得了大量的實際知識。這些知識嵌入到它們的參數中,然後可以在需要時使用。這些模型的知識在訓練結束時被「具體化」。在預訓練結束時,模型實際上停止學習。對模型進行對齊或進行指令調優,讓模型學習如何充分利用這些知識,以及如何更自然地回應使用者的問題。但是有時模型知識是不夠的,儘管模型可以透過RAG存取外部內容,但透過微調使用模型適應新的領域被認為是有益的。這種微調是使用人工標註者或其他llm創建的輸入進行的,模型會遇到額外的實際知識並將其整合

全尺寸通用人形機器人青龍亮相WAIC,加速邁入具身智慧時代 全尺寸通用人形機器人青龍亮相WAIC,加速邁入具身智慧時代 Jul 11, 2024 pm 02:03 PM

7月4日下午,由世界人工智慧大會組委會辦公室指導,世界人工智慧大會組委會辦公室主辦,國家地方共建人形機器人創新中心、中國電子學會承辦,本站、《機器人技術與應用》雜誌協辦的2024WAIC世界人工智慧大會人形機器人與具身智慧發展論壇將於7月4日下午在上海世博展覽館舉行。本次論壇邀請了12位國內外人形機器人與具身智慧領域的學者、企業代表以及開發者代表進行了主旨報告、技術分享和圓桌討論,並發布了人形機器人創新成果。論壇現場吸引了200多位人形機器人及具身智慧領域的專業觀眾,同時透過多個直播平台在線上觀看

用蘋果Vision Pro隔空操控機器人,英偉達:「人機合一」也不難嘛 用蘋果Vision Pro隔空操控機器人,英偉達:「人機合一」也不難嘛 Aug 01, 2024 am 03:16 AM

黃仁勳表示:「AI的下一波浪潮是機器人,其中最令人興奮的發展之一是人形機器人。」如今,ProjectGR00T又邁出了重要的一步。昨日,英偉達創辦人黃仁勳在SIGGRAPH2024Keynote演講中講到了其人形機器人通用基礎模式「ProjectGR00T」。該模型在功能上迎來了一系列更新。德州大學奧斯汀分校助理教授、英偉達高級研究科學家朱玉可發推,在影片中示範了英偉達如何將通用家務機器人大規模模擬訓練框架RoboCasa和MimicGen系統整合到英偉達Omniverse平台和Isaac機

你所不知道的機器學習五大學派 你所不知道的機器學習五大學派 Jun 05, 2024 pm 08:51 PM

機器學習是人工智慧的重要分支,它賦予電腦從數據中學習的能力,並能夠在無需明確編程的情況下改進自身能力。機器學習在各個領域都有廣泛的應用,從影像辨識和自然語言處理到推薦系統和詐欺偵測,它正在改變我們的生活方式。機器學習領域存在著多種不同的方法和理論,其中最具影響力的五種方法被稱為「機器學習五大派」。這五大派分別為符號派、聯結派、進化派、貝葉斯派和類推學派。 1.符號學派符號學(Symbolism),又稱符號主義,強調利用符號進行邏輯推理和表達知識。該學派認為學習是一種逆向演繹的過程,透過現有的

為大模型提供全新科學複雜問答基準與評估體系,UNSW、阿貢、芝加哥大學等多家機構共同推出SciQAG框架 為大模型提供全新科學複雜問答基準與評估體系,UNSW、阿貢、芝加哥大學等多家機構共同推出SciQAG框架 Jul 25, 2024 am 06:42 AM

編輯|ScienceAI問答(QA)資料集在推動自然語言處理(NLP)研究中發揮著至關重要的作用。高品質QA資料集不僅可以用於微調模型,也可以有效評估大語言模型(LLM)的能力,尤其是針對科學知識的理解和推理能力。儘管目前已有許多科學QA數據集,涵蓋了醫學、化學、生物等領域,但這些數據集仍有一些不足之處。其一,資料形式較為單一,大多數為多項選擇題(multiple-choicequestions),它們易於進行評估,但限制了模型的答案選擇範圍,無法充分測試模型的科學問題解答能力。相比之下,開放式問答

See all articles