首頁 科技週邊 人工智慧 陪跑又快又穩,機器人跑步搭子來了

陪跑又快又穩,機器人跑步搭子來了

Feb 16, 2024 pm 06:50 PM
產業 cassie

這個機器人名叫Cassie,曾經創下百公尺跑世界紀錄。最近,加州大學柏克萊分校的研究者為它開發了一種新的深度強化學習演算法,讓它掌握了急轉彎等技能,還能對抗各種幹擾。

陪跑又快又穩,機器人跑步搭子來了                                             【關注本站影片號,第一時間看到有趣的AI 內容】
關於雙足機器人運動的研究已經進行了幾十年,但仍然沒有一個能夠對各種運動技能進行穩健控制的通用框架。挑戰來自於雙足機器人欠驅動動態的複雜性以及與每種運動技能相關的不同規劃。

研究者希望解決的關鍵問題在於:如何為高維度人體大小的雙足機器人開發解決方案?如何控制多樣化、敏捷和穩健的腿部運動技能,例如行走、跑步和跳躍?

最近的一項研究或許提供了一個不錯的方案。

在這項工作中,來自柏克萊等機構的研究者利用強化學習(RL)為現實世界中的高維非線性雙腳機器人創建控制器,以應對上述挑戰。這些控制器可以利用機器人的本體感覺訊息來適應隨時間變化的不確定動態,同時能夠適應新的環境和設置,利用雙足機器人的敏捷性,在突發情況下表現出穩健的行為。此外,本文框架也提供了再現各種雙足運動技能的通用配方。
陪跑又快又穩,機器人跑步搭子來了
  • 論文標題:Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal Locomotion Control
  • #論文鏈接:https://arxiv.org/pdf/2401.16889.pdf

論文細節

#對於控制器來說,扭矩控制人體大小的雙足機器人的高維度和非線性乍似乎是障礙,然而這些特性的優勢在於可以透過機器人的高維動力學實現複雜的敏捷操作。

這項控制器賦予機器人的技能如圖 1 所示,包括穩健的站立、行走、奔跑和跳躍。這些技能還可用於執行各種不同的任務,包括以不同速度和高度行走、以不同速度和方向奔跑以及跳向各種目標,同時在實際部署過程中保持穩健性。為此,研究者利用無模型 RL 讓機器人透過系統全階動態的試誤來學習。除了真實世界的實驗,還深入分析了使用 RL 進行腿部運動控制的好處,並詳細研究如何有效地建立學習過程以利用這些優勢,如適應性和穩健性。
陪跑又快又穩,機器人跑步搭子來了
用於通用雙足運動控制的RL 系統如圖2 所示:
陪跑又快又穩,機器人跑步搭子來了
第四節首先介紹了在運動控制中利用機器人I/O 歷史記錄的重要性,這一節從控制和RL 兩個角度展示了機器人的長期I/O 歷史可以在實時控制過程中實現系統識別和狀態估計。

第五節介紹了研究的核心:一種利用雙足機器人長期和短期 I/O 雙歷史記錄的新型控制架構。具體來說,這種控制架構不僅能利用機器人的長期歷史記錄,還能利用機器人的短期歷史記錄。

控制框架如下圖:
陪跑又快又穩,機器人跑步搭子來了
#在這個雙歷史記錄結構中,長期歷史記錄帶來了適應性(在第八節中得到驗證),短期歷史記錄則透過實現更好的即時控制對長期歷史記錄的利用進行了補充(在第七節中得到驗證)。

第六節介紹如何將由深度神經網路表示的控制策略透過無模型 RL 進行最佳化。鑑於研究者旨在開發一種能夠利用高動態運動技能完成各種任務的控制器,因此這一節中的訓練以多階段模擬訓練為特徵。這種訓練策略提供了一個結構化的課程,首先是單一任務訓練,即機器人專注於一個固定的任務,然後是任務隨機化,使機器人接受的訓練任務多樣化,最後是動態隨機化,改變機器人的動態參數。

策略如下圖所示:
陪跑又快又穩,機器人跑步搭子來了
#這種訓練策略能夠提供一個多功能控制策略,可以執行多種任務,並實現機器人硬體的零樣本遷移。此外,任務隨機化還能透過在不同的學習任務中進行泛化來增強所產生策略的穩健性。

研究表明,這種穩健性可以使機器人對幹擾做出順從的行為,這與動態隨機化帶來的干擾是「正交」的。這一點將在第九節中得到驗證。

利用這個框架,研究者獲得了雙足機器人 Cassie 的行走、跑步和跳躍技能的多功能策略。第十章評估了這些控制策略在現實世界中的有效性。

實驗

#研究者對機器人進行了廣泛的實驗,包括在現實世界中行走、跑步和跳躍等多項能力的測試。所用策略在經過模擬訓練後都能夠有效地控制現實世界中的機器人,而無需進一步調整。

行走實驗

#如圖14a 所示,行走策略展示了對機器人遵循不同指令的有效控制,在整個測試過程中,追蹤誤差相當低(追蹤誤差由MAE 的值來評估)。

此外,機器人策略在較長時間內始終表現良好,即使在325 天和492 天後仍具有保持跟踪可變命令的能力,分別如圖14c 和圖14b 所示。儘管在此期間機器人的動力學發生了顯著的累積變化,但圖 14a 中的同一控制器繼續有效地管理不同的行走任務,並且追蹤誤差的退化最小。
陪跑又快又穩,機器人跑步搭子來了
如圖 15 所示,該研究所使用的策略顯示出對機器人可靠的控制,使機器人能夠準確地追蹤順時針或逆時針的不同轉彎指令。
陪跑又快又穩,機器人跑步搭子來了
快速行走實驗。除了中等行走速度之外,實驗還展示了所用策略控制機器人向前和向後執行快速行走動作的能力,如圖 16 所示。機器人可以從靜止狀態過渡到快速實現向前行走速度,平均速度達到1.14 m/s(追蹤指令中要求1.4 m/s),機器人還能依照指令快速返回站立姿態,如圖16a 所示,數據記錄在圖16c 中。
陪跑又快又穩,機器人跑步搭子來了
在不平坦的地形上(未經訓練),機器人也可以在樓梯或下坡上有效地向後行走,如下圖所示。
陪跑又快又穩,機器人跑步搭子來了
抗擾動。在脈衝擾動的情況下,例如研究者在機器人步行時從各個方向向機器人引入了短時間內的外部擾動。就像圖 18a 中記錄的那樣,在原地行走時向機器人施加相當大的橫向擾動力,橫向速度峰值為 0.5 m/s。儘管有擾動,機器人仍能迅速從橫向偏差中恢復。如圖 18a 所示,機器人熟練地沿著相反的橫向方向移動,有效地補償擾動並恢復其穩定的原地行走步態。
陪跑又快又穩,機器人跑步搭子來了
在持續擾動測試期間,人類對機器人底座施加擾動力量,並沿著隨機方向拖曳機器人,同時命令機器人原地行走。如圖 19a 所展示的,當機器人正常行走時,持續的橫向拖曳力施加到 Cassie 的底座上。結果顯示機器人在不失去平衡的情況下,透過遵循這些外力的方向來表現出對這些外力的順應性。這也顯示了本文提出的基於強化學習的策略在控制雙足機器人以實現安全人機互動等潛在應用的優勢。

跑步實驗

#當機器人使用雙足跑步策略,在2 分34秒內實現了400 公尺衝刺,在27.06 秒內實現了100 公尺衝刺,跑步傾斜度高達10° 等等。

400 公尺短跑:研究首先評估了在標準室外跑道上完成 400 公尺短跑的一般跑步策略,如圖 20 所示。在整個測試過程中,機器人被命令以 3.5 m/s 的速速同時響應由操作員發出的不同轉彎命令。機器人能夠從站立姿態平滑地過渡到跑步步態(圖 20a 1)。機器人設法加速到平均估計運行速度 2.15 m/s,達到峰值估計速度 3.54 m/s,如圖 20b 所示。該策略使機器人成功地在整個 400 公尺跑步過程中始終保持所需的速度,同時準確地遵守不同的轉彎命令。
陪跑又快又穩,機器人跑步搭子來了
在所提出的跑步策略的控制下,Cassie 在 2 分 34 秒內成功完成了 400 公尺衝刺,隨後能夠過渡到站立姿態。

該研究進一步進行了急轉彎測試,其中機器人被給予偏航命令的階躍變化,從0 度直接到90 度,如圖21c 中記錄的。機器人可以回應這樣的步進指令,並在 2 秒 5 步內完成 90 度急轉彎。
陪跑又快又穩,機器人跑步搭子來了
100 公尺短跑:如圖22 所示,透過部署所提出的跑步策略,機器人在大約28 秒內完成了100 公尺短跑,實現了27.06 秒的最快跑步時間。
陪跑又快又穩,機器人跑步搭子來了
跳躍實驗

#透過實驗證明,研究者發現很難訓練機器人在跳躍到高架平台的同時同時轉彎,但所提出的跳躍策略實現了機器人多種不同的雙足跳躍,包括可以跳躍1.4 公尺以及跳到0.44 公尺高架平台上。

跳躍和轉彎:如圖25a 所示,使用單次跳躍策略,機器人能夠執行各種給定的目標跳躍,例如旋轉60° 時原地跳躍、向後跳躍到後方0.3 公尺處著陸等。
陪跑又快又穩,機器人跑步搭子來了
跳躍到高架平台:如圖25b 所示,機器人能夠精確地跳躍到不同位置的目標上,例如前方1 米或前方1.4 米,它還能跳到不同高度的位置,包括跳到0.44 公尺高的地方(考慮到機器人本身只有1.1 公尺高)。

了解更多內容,請參考原文。

以上是陪跑又快又穩,機器人跑步搭子來了的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

<🎜>:泡泡膠模擬器無窮大 - 如何獲取和使用皇家鑰匙
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
Mandragora:巫婆樹的耳語 - 如何解鎖抓鉤
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
北端:融合系統,解釋
3 週前 By 尊渡假赌尊渡假赌尊渡假赌

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Java教學
1668
14
CakePHP 教程
1426
52
Laravel 教程
1329
25
PHP教程
1273
29
C# 教程
1256
24
DeepMind機器人打乒乓球,正手、反手溜到飛起,全勝人類初學者 DeepMind機器人打乒乓球,正手、反手溜到飛起,全勝人類初學者 Aug 09, 2024 pm 04:01 PM

但可能打不過公園裡的老大爺?巴黎奧運正在如火如荼地進行中,乒乓球項目備受關注。同時,機器人打乒乓球也取得了新突破。剛剛,DeepMind提出了第一個在競技乒乓球比賽中達到人類業餘選手等級的學習型機器人智能體。論文地址:https://arxiv.org/pdf/2408.03906DeepMind這個機器人打乒乓球什麼程度呢?大概和人類業餘選手不相上下:正手反手都會:對手採用多種打法,機器人也能招架得住:接不同旋轉的發球:不過,比賽激烈程度似乎不如公園老大爺對戰。對機器人來說,乒乓球運動

首配機械爪!元蘿蔔亮相2024世界機器人大會,發布首個走進家庭的西洋棋機器人 首配機械爪!元蘿蔔亮相2024世界機器人大會,發布首個走進家庭的西洋棋機器人 Aug 21, 2024 pm 07:33 PM

8月21日,2024世界機器人大會在北京隆重召開。商湯科技旗下家用機器人品牌「元蘿蔔SenseRobot」家族全系產品集體亮相,並最新發布元蘿蔔AI下棋機器人-國際象棋專業版(以下簡稱「元蘿蔔國象機器人」),成為全球首個走進家庭的西洋棋機器人。作為元蘿蔔的第三款下棋機器人產品,全新的國象機器人在AI和工程機械方面進行了大量專項技術升級和創新,首次在家用機器人上實現了透過機械爪拾取立體棋子,並進行人機對弈、人人對弈、記譜複盤等功能,

Claude也變懶了!網友:學會給自己放假了 Claude也變懶了!網友:學會給自己放假了 Sep 02, 2024 pm 01:56 PM

開學將至,該收心的不只即將開啟新學期的同學,可能還有AI大模型。前段時間,Reddit擠滿了吐槽Claude越來越懶的網友。 「它的水平下降了很多,經常停頓,甚至輸出也變得很短。在發布的第一周,它可以一次性翻譯整整4頁文稿,現在連半頁都輸出不了!」https:// www.reddit.com/r/ClaudeAI/comments/1by8rw8/something_just_feels_wrong_with_claude_in_the/在一個名為“對Claude徹底失望了的帖子裡”,滿滿地

世界機器人大會上,這家承載「未來養老希望」的國產機器人被包圍了 世界機器人大會上,這家承載「未來養老希望」的國產機器人被包圍了 Aug 22, 2024 pm 10:35 PM

在北京舉行的世界機器人大會上,人形機器人的展示成為了現場絕對的焦點,在星塵智能的展台上,由於AI機器人助理S1在一個展區上演揚琴、武術、書法三台大戲,能文能武,吸引了大量專業觀眾和媒體的駐足。在有彈性的琴弦上優雅的演奏,讓S1展現出速度、力度、精準度兼具的精細操作與絕對掌控。央視新聞對「書法」背後的模仿學習和智慧控制進行了專題報道,公司創始人來傑解釋到,絲滑動作的背後,是硬體側追求最好力控和最仿人身體指標(速度、負載等),而是在AI側則採集人的真實動作數據,讓機器人遇強則強,快速學習進化。而敏捷

ACL 2024獎項發表:華科大破解甲骨文最佳論文之一、GloVe時間檢驗獎 ACL 2024獎項發表:華科大破解甲骨文最佳論文之一、GloVe時間檢驗獎 Aug 15, 2024 pm 04:37 PM

本屆ACL大會,投稿者「收穫滿滿」。為期六天的ACL2024正在泰國曼谷舉辦。 ACL是計算語言學和自然語言處理領域的頂級國際會議,由國際計算語言學協會組織,每年舉辦一次。一直以來,ACL在NLP領域的學術影響力都名列第一,它也是CCF-A類推薦會議。今年的ACL大會已是第62屆,接收了400餘篇NLP領域的前沿工作。昨天下午,大會公佈了最佳論文等獎項。此次,最佳論文獎7篇(兩篇未公開)、最佳主題論文獎1篇、傑出論文獎35篇。大會也評出了資源論文獎(ResourceAward)3篇、社會影響力獎(

李飛飛團隊提出ReKep,讓機器人具備空間智能,還能整合GPT-4o 李飛飛團隊提出ReKep,讓機器人具備空間智能,還能整合GPT-4o Sep 03, 2024 pm 05:18 PM

視覺與機器人學習的深度融合。當兩隻機器手絲滑地互相合作疊衣服、倒茶、將鞋子打包時,加上最近老上頭條的1X人形機器人NEO,你可能會產生一種感覺:我們似乎開始進入機器人時代了。事實上,這些絲滑動作正是先進機器人技術+精妙框架設計+多模態大模型的產物。我們知道,有用的機器人往往需要與環境進行複雜精妙的交互,而環境則可被表示成空間域和時間域上的限制。舉個例子,如果要讓機器人倒茶,那麼機器人首先需要抓住茶壺手柄並使之保持直立,不潑灑出茶水,然後平穩移動,一直到讓壺口與杯口對齊,之後以一定角度傾斜茶壺。這

分散式人工智慧盛會DAI 2024徵稿:Agent Day,強化學習之父Richard Sutton將出席!顏水成、Sergey Levine以及DeepMind科學家將做主旨報告 分散式人工智慧盛會DAI 2024徵稿:Agent Day,強化學習之父Richard Sutton將出席!顏水成、Sergey Levine以及DeepMind科學家將做主旨報告 Aug 22, 2024 pm 08:02 PM

會議簡介隨著科技的快速發展,人工智慧成為了推動社會進步的重要力量。在這個時代,我們有幸見證並參與分散式人工智慧(DistributedArtificialIntelligence,DAI)的創新與應用。分散式人工智慧是人工智慧領域的重要分支,這幾年引起了越來越多的關注。基於大型語言模型(LLM)的智能體(Agent)異軍突起,透過結合大模型的強大語言理解和生成能力,展現了在自然語言互動、知識推理、任務規劃等方面的巨大潛力。 AIAgent正在接棒大語言模型,成為目前AI圈的熱門話題。 Au

鴻蒙智行享界S9全場景新品發表會,多款重磅新品齊發 鴻蒙智行享界S9全場景新品發表會,多款重磅新品齊發 Aug 08, 2024 am 07:02 AM

今天下午,鸿蒙智行正式迎来了新品牌与新车。8月6日,华为举行鸿蒙智行享界S9及华为全场景新品发布会,带来了全景智慧旗舰轿车享界S9、问界新M7Pro和华为novaFlip、MatePadPro12.2英寸、全新MatePadAir、华为毕昇激光打印机X1系列、FreeBuds6i、WATCHFIT3和智慧屏S5Pro等多款全场景智慧新品,从智慧出行、智慧办公到智能穿戴,华为全场景智慧生态持续构建,为消费者带来万物互联的智慧体验。鸿蒙智行:深度赋能,推动智能汽车产业升级华为联合中国汽车产业伙伴,为

See all articles