CMU機器狗,倒立下樓!發布即開源
機器狗的花樣真的太多了—
但今天還是有被驚艷到。
來自CMU的最新成果,直接讓狗子學會了:
兩倍身長的跳高、跳遠、倒立撒歡兒甚至倒立下樓梯
話不多說,直接放圖感受一波:
△ 這是跳遠
△ 這是跳高
#△ 倒立撒歡兒
要重寫的內容是:△倒立下樓梯
不得不說,尤其跳高那段的「掙扎」顯得狗子特別靈魂。
除了這些s操作,CMU也公佈了幾段跑酷視頻,完全自主的那種。
踏上坎兒、穿過縫隙、跨過斜坡,那真是一種暢快的感覺
#即使中間出現了一些“失誤”,也絲毫不會影響它立即前進
笑鼠,甚至還給安排了一段壓力測試,結果當然是「通過」~
最厲害的是,根據CMU介紹,以上這些極限操作,全部靠單一神經網路完成。
LeCun大佬聽了,都得反手一個讚。
如此靈魂,如何煉成?
在這篇推文中,作者詳細分析了這隻狗子的技術
首先,與基於視覺的端到端行走相比,2倍身長跳高跳遠這種極限操作完全不在同一個層次上
畢竟,任何一個錯誤都可能造成「致命的」後果
#對此,CMU採用sim2real來實現精準的足部控制和挑戰,最大限度地發揮機械優勢。
其中,Gym是用於模擬器的
再者,倒立。明顯地,用兩條腿行走比用四條腿要困難得多
然而,卡內基梅隆大學的機器狗採用了相同的基本方法來同時完成這兩個任務,甚至能夠在下樓梯的同時保持倒立狀態
第三,對於跑酷操作來說(本研究重點),機器狗必須透過精確的「眼部肌肉」協調來#自己決定前進方向,而非聽從人類指揮。
例如,當連續經過兩個斜坡時,它需要以一個非常特定的角度跳上坡道,然後立即改變方向
為了學會這些正確的方向,CMU使用MTS(Mixed Teacher Student)系統來教導機器狗。
系統只有在預測方向接近真實值的情況下才會採納
具體而言,該系統分為兩個階段:
第一階段,先利用RL學習一種移動策略,該過程可以訪問一些特權信息,除了環境參數和掃描點(scandots)以外,CMU還為機器狗適當提供了一些標誌點(waypoints),目的是引導大體方向。
然後,使用正規化線上自適應(Regularized Online Adaptation ,ROA)來訓練評估器,以便從觀察歷史中恢復環境資訊。
第二階段,從掃描點(scandots)中提取策略,系統將根據該策略和深度資訊自主決定如何前進,從而敏捷地輸出馬達命令。
整個過程就像「老師教,學生舉一反三學習」
除了這個系統之外,由於跑酷需要用上各種不同動作穿越障礙,因此為每一個障礙設計特定獎勵函數也是一件頭痛的事兒。
在此,作者選擇為所有任務制定了一個統一且簡單的內積獎勵函數。
它能夠自動產生各種不同的獎勵,並且能夠完全適應各種不同的地形形狀
如果沒有它,狗子的表現就會是這樣的:
最後,CMU也提出了一種全新的雙重蒸餾(dual distillation)方法,用於從深度影像中提取敏捷的運動指令和快速波動的前進方向。
同樣,如果沒有它,狗子的表現就像一個醉漢一樣:
#經過以上步驟,這隻狗終於學會了全新的自主跑酷,能夠完成一些高難度的動作
是不是很心動?別急:
以上這些成果,CMU已全部開源(瞧這日期,還是熱乎的呢)。
同時,這篇論文也已經發布了。大家可以在結尾處取得
作者介紹
這項研究是由卡內基美隆大學完成的,共有四位作者參與
其中兩位共同一作,且都是華人:
一位叫Xuxin Cheng,這項工作是他在CMU讀研時完成的,他現在是加州大學聖地牙哥分校(UCSD)的博士生,導師為王小龍;
另一位叫石可心,CMU機器人研究所的訪問學者。她本科畢業於西安交大。
專案首頁連結:https://extreme-parkour.github.io/(含論文、程式碼等連結)
以上是CMU機器狗,倒立下樓!發布即開源的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

使用C 中的chrono庫可以讓你更加精確地控制時間和時間間隔,讓我們來探討一下這個庫的魅力所在吧。 C 的chrono庫是標準庫的一部分,它提供了一種現代化的方式來處理時間和時間間隔。對於那些曾經飽受time.h和ctime折磨的程序員來說,chrono無疑是一個福音。它不僅提高了代碼的可讀性和可維護性,還提供了更高的精度和靈活性。讓我們從基礎開始,chrono庫主要包括以下幾個關鍵組件:std::chrono::system_clock:表示系統時鐘,用於獲取當前時間。 std::chron

DMA在C 中是指DirectMemoryAccess,直接內存訪問技術,允許硬件設備直接與內存進行數據傳輸,不需要CPU干預。 1)DMA操作高度依賴於硬件設備和驅動程序,實現方式因係統而異。 2)直接訪問內存可能帶來安全風險,需確保代碼的正確性和安全性。 3)DMA可提高性能,但使用不當可能導致系統性能下降。通過實踐和學習,可以掌握DMA的使用技巧,在高速數據傳輸和實時信號處理等場景中發揮其最大效能。

在C 中處理高DPI顯示可以通過以下步驟實現:1)理解DPI和縮放,使用操作系統API獲取DPI信息並調整圖形輸出;2)處理跨平台兼容性,使用如SDL或Qt的跨平台圖形庫;3)進行性能優化,通過緩存、硬件加速和動態調整細節級別來提升性能;4)解決常見問題,如模糊文本和界面元素過小,通過正確應用DPI縮放來解決。

C 在實時操作系統(RTOS)編程中表現出色,提供了高效的執行效率和精確的時間管理。 1)C 通過直接操作硬件資源和高效的內存管理滿足RTOS的需求。 2)利用面向對象特性,C 可以設計靈活的任務調度系統。 3)C 支持高效的中斷處理,但需避免動態內存分配和異常處理以保證實時性。 4)模板編程和內聯函數有助於性能優化。 5)實際應用中,C 可用於實現高效的日誌系統。

在MySQL中,添加字段使用ALTERTABLEtable_nameADDCOLUMNnew_columnVARCHAR(255)AFTERexisting_column,刪除字段使用ALTERTABLEtable_nameDROPCOLUMNcolumn_to_drop。添加字段時,需指定位置以優化查詢性能和數據結構;刪除字段前需確認操作不可逆;使用在線DDL、備份數據、測試環境和低負載時間段修改表結構是性能優化和最佳實踐。

在C 中測量線程性能可以使用標準庫中的計時工具、性能分析工具和自定義計時器。 1.使用庫測量執行時間。 2.使用gprof進行性能分析,步驟包括編譯時添加-pg選項、運行程序生成gmon.out文件、生成性能報告。 3.使用Valgrind的Callgrind模塊進行更詳細的分析,步驟包括運行程序生成callgrind.out文件、使用kcachegrind查看結果。 4.自定義計時器可靈活測量特定代碼段的執行時間。這些方法幫助全面了解線程性能,並優化代碼。

交易所內置量化工具包括:1. Binance(幣安):提供Binance Futures量化模塊,低手續費,支持AI輔助交易。 2. OKX(歐易):支持多賬戶管理和智能訂單路由,提供機構級風控。獨立量化策略平台有:3. 3Commas:拖拽式策略生成器,適用於多平台對沖套利。 4. Quadency:專業級算法策略庫,支持自定義風險閾值。 5. Pionex:內置16 預設策略,低交易手續費。垂直領域工具包括:6. Cryptohopper:雲端量化平台,支持150 技術指標。 7. Bitsgap:

如何實現鼠標滾動事件穿透效果?在我們瀏覽網頁時,經常會遇到一些特別的交互設計。比如在deepseek官網上,�...
