2 個月不見,人形機器人 Walker S 會摺衣服了
機器之能報道
編輯:吳昕
國內版的人形機器人 大模型組隊,首次完成疊衣服這類複雜柔性材料的操作任務。
隨著融合了 OpenAI 多模態大模型的 Figure 01 揭開神秘面紗, 國內同行的相關進展一直備受關注。
就在昨天,國內 " 人形機器人第一股 " 優必選發布了人形機器人 Walker S 深入融合百度文心大模型後的首個 Demo,展示了一些有趣的新功能。
現在,得到百度文心大模型能力加持的 Walker S 是這個樣子的。
和 Figure 01 一樣,Walker S 沒有走動,而是站在桌子後面完成一系列任務。它可以聽從人類的命令,折疊衣物。
完成任務後,你還可以和它聊天。例如問詢這件黑色上衣搭配什麼比較適合?機器人依然記得你要出差這件事,建議搭配深色褲子更適合正式場合。
它也會將桌上的各種開關歸置到盤子裡。
即使被幹擾,例如歸置好的開關又被丟回桌子上,或者眼看就要拿到手的插座又被移開了,Walker S 都能即時調整工作狀態,根據新情況完成歸置任務。
2 月,在新能源車廠訓練時 , Walker S 就已展現出多模態感知與運動控制能力。
此次,透過與文心大模型的深度融合,Walker S 的認知和操控能力再上台階,不僅獲得了高級意圖理解和細粒度任務規劃能力,更首次完成了疊衣服這類複雜柔性材料操作任務。
文心大模型系文心產業級知識增強大模型,具備跨模態、跨語言的深度語意理解與生成能力,還有知識推理、任務規劃等能力。透過將這些能力移植到人形機器人,可以讓機器人像人一樣對衣物的材質、形狀、褶皺等屬性進行分析和理解,並根據過往經驗推理出最佳的疊衣方式和順序。在實際疊衣過程中 , 機器人會即時分析衣物的狀態變化,並相應地調整自己的動作策略。
在物件幹擾分類任務中 , Walker S 也充分發揮了 "AI 大模型 機器人 " 的協同優勢。首先,透過端側的多模態感知模型獲取物體的空間定位和語義訊息,再將這些訊息交由大模型進行智慧處理,後者憑藉其出色的任務拆解和邏輯推理能力為Walker S 快速構建出最優的任務規劃和執行路徑。 Walker S 則將這套方案映射到機械手臂和靈巧手的實際操控中,最終流暢完成整套複雜任務。
此舉也是國內同行類似能力的首秀,其創新應用和實現難度在全球範圍內也屬於行業第一梯隊水平。 " 在許多展示中,包括 Figure 與 OpenAI 合作、我們與百度的合作,目前可以實現端到端。" 優必選管理層在昨晚的業績回顧與展望會上向第一財經記者表示。
" 我們利用了百度的大模型對任務的拆解、對自然語言的理解和順序邏輯排列等。除了公司去年基於開源模型訓練構建的基於端側的多模態大模型外,我們認為未來人形機器人市場競爭越來越激烈的情況下,強強聯合才能實現1 1>2。" 優必選管理層解釋這次合作時稱," 國外特斯拉有大模型能力,有OpenAI、英偉達與Figure 的結合等,可以看到合作能為人形機器人落地提供強大技術支撐。"
不過,透過對比OpenAI 的視頻,我們發現被賦能後的Walker S 仍然與Figure 01 存在差距。
最明顯的是動作速度。另外在指令內容上,Walker S 所接收的指令通常比較明確和具體,Figure 01 則能根據更抽象的指令,藉由常識推理將其轉化為合理可行的具體操作。
此外,Figure 01 能一邊工作一邊閒聊(尤其是解釋自己的操作),並具備短期記憶能力,可根據先前的對話內容來合理規劃當前的行動。
隨著生成式AI 競爭的日趨激烈,以及研究重點從長文本、多模態延伸到具身智能,我們有理由相信未來的人形機器人將不再局限於感知靜態數據,而是能夠在虛擬乃至真實的立體世界中自由行動、與環境互動。這也標誌著 AI 將實現從簡單的機器學習到複雜類人任務執行的重大跨越。
事實上,人形機器人賽道在過去半年已呈現出異常火熱的勢頭 , 國內外原型機頻頻亮相 , 新創公司融資活躍。 2 月優必選曝光 Walker S 在蔚來新能源汽車工廠試用的視頻,機器人可以流暢完成安全帶檢測、車標貼附等工作。優必選股價也曾在 3 月初兩天暴漲 200%。
不過,目前全球人形機器人仍處於試驗階段,規模化放量仍需時間。畢竟 ,demo 和實際應用的差異非常大,後者更要通盤考慮可靠性、穩定性、成本等一系列要素。優必選方面表示,AI 大模型與人形機器人的結合,將極大提升後者的智慧化程度和多場景任務適應能力,並加速其產業化進程。創辦人周劍也公開表示,希望今年年底完成第一批人形機器人在工廠的落地,透過測試並為 2025 年人形機器人形成批量爆發做準備。此外,今年底優必選計畫推出第一代家庭端情感陪護人形機器人,該機器人將搭載大模型,能與使用者互動並形成短期、長期記憶。
參考連結
https://www.stcn.com/article/detail/1164967.html
THE END
## 轉載請聯絡本公眾號授權投稿或尋求報告:content@jiqizhixin.com以上是2 個月不見,人形機器人 Walker S 會摺衣服了的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

熱門話題

在加密貨幣交易日益普及的今天,選擇安全可靠的交易平台至關重要。歐易OKX作為全球領先的數字資產交易平台,以其高安全性、豐富的交易品種、良好的流動性及用戶體驗而備受青睞。然而,網絡上充斥著虛假信息,許多用戶難以辨別歐易OKX官方網址。本文將指導您如何安全快速地訪問歐易OKX官方平台,避免誤入釣魚網站,保障您的數字資產安全。我們將介紹通過搜索引擎、第三方網站、官方社交媒體以及官方App等多種方法查找官方入口鏈接,並提供重要的安全提示,幫助您在歐易OKX平台上進行安全可靠的加密貨幣交易。

公司安全軟件與應用兼容性問題及排查方法許多企業為了保障內網安全,會安裝安全軟件。然而,安全軟件有時...

C35 的計算本質上是組合數學,代表從 5 個元素中選擇 3 個的組合數,其計算公式為 C53 = 5! / (3! * 2!),可通過循環避免直接計算階乘以提高效率和避免溢出。另外,理解組合的本質和掌握高效的計算方法對於解決概率統計、密碼學、算法設計等領域的許多問題至關重要。

Bootstrap 圖片居中方法多樣,不一定要用 Flexbox。如果僅需水平居中,text-center 類即可;若需垂直或多元素居中,Flexbox 或 Grid 更合適。 Flexbox 兼容性較差且可能增加複雜度,Grid 則更強大且學習成本較高。選擇方法時應權衡利弊,並根據需求和偏好選擇最適合的方法。

網頁批註功能的Y軸位置自適應算法本文將探討如何實現類似Word文檔的批註功能,特別是如何處理批註之間的間�...

PHP二維數組排序及排名實現詳解本文將詳細講解如何對一個PHP二維數組進行排序,並根據排序結果為每個子數組...

在數字貨幣交易日益火熱的今天,選擇安全可靠的交易平台至關重要。 OKX作為全球領先的數字資產交易所,其安全性備受關注。然而,眾多釣魚網站冒充OKX官方,導致用戶面臨賬戶安全和資產損失的風險。本文將為您詳細講解如何識別並訪問真正的歐易OKX官方網站及APP入口,避免釣魚網站陷阱,保障您的數字資產安全。 通過官方網站驗證、官方App下載、官方社交媒體渠道以及官方客服諮詢等多種途徑,您可以有效識別並訪問OKX官方平台,確保您的交易安全。 請務必仔細核對域名、檢查HTTPS協議,並提高網絡安全意識,保

如何讓同一行相鄰列的高度自動適應內容?在網頁設計中,我們經常會遇到這樣的問題:當一個表格或行內的多...
