首頁 > 科技週邊 > 人工智慧 > 圖形的螺旋:將類似人類的機器人帶到您家的AI -Analytics Vidhya

圖形的螺旋:將類似人類的機器人帶到您家的AI -Analytics Vidhya

Lisa Kudrow
發布: 2025-03-04 09:09:10
原創
766 人瀏覽過

圖AI揭示了螺旋:由視覺語言動作(VLA)框架提供動力的革命性人形機器人。 這種創新的方法使Helix能夠以前所未有的類似人類的能力來推理和運作,從而彌合了受控工業機器人技術與家庭環境中不可預測的動態之間的差距。 此詳細概述探索了基於最近發布的文檔和演示的Helix的功能。

目錄的

表:

了解螺旋
  • 建築設計:系統1&System 2
  • 系統2:“大腦”
    • >系統1:精確的操作執行
    關鍵技術進步
  • 演示視頻
  • >協作雜貨處理
  • 全部上色電動機控制
  • 語言引導的對像操縱
  • 摘要
理解螺旋:

螺旋具有35度的自由度(DOF),為人形機器人提供了無與倫比的靈活性和自主性。與需要大量手動編程的傳統機器人不同,Helix使用簡單的自然語言說明動態執行複雜的長期任務。這一突破顯著提高了機器人在家庭環境中的實用性,在這種情況下,對各種物體和不可預測的場景的適應性至關重要。

>

建築設計:系統1&System 2:

> 螺旋的架構反映了人類的認知過程,從卡尼曼的“思維,快速和慢”模型中汲取靈感:

Figure's Helix: AI that Brings Human-Like Robots to your Home - Analytics Vidhya

    系統2:“大腦”:這個70億參數的視覺語言模型(VLM)處理高級推理,語言理解和視覺場景的理解。 它將抽象命令(例如“撿起沙漠物品”)轉換為可行的步驟。 >
  • 系統1:精確的動作執行:基於系統2的指令,該8000萬參數視覺運動策略可確保快速,低水平的控制(例如掌握和對像操縱)。 它的緊湊尺寸可實現快速的實時響應。

  • >兩個系統都在低功率嵌入式GPU上運行,消除了對外部計算資源的依賴,並為商業可行性鋪平了道路。 關鍵技術進步:

    • > 統一的神經網絡:螺旋螺旋用於所有行為(挑選,放置,抽屜操作,製冷,多機器人交互),消除了對特定於任務特定的微型調整的需求。
    • >>>>>>
    • >直播行為生成:螺旋為看不見的對像生成智能的新型行為,最大程度地減少了對人類編程或示範的需求。
    • 商業準備:它的嵌入式GPU體系結構可確保現實世界的適用性,而沒有基於雲的系統的延遲和依賴性問題。
    演示視頻:

    圖AI通過幾個引人入勝的視頻展示了Helix的功能:

    協作雜貨儲存:
      兩個螺旋驅動的機器人協作存儲不熟悉的雜貨,展示了協調性和適應性。 基於自然語言命令的
    1. > >對像操作:機器人執行各種任務(挑選,放置,抽屜操作,冰箱互動)。 >
    2. >概念推理: Helix解釋了抽象命令,例如“拾取沙漠項目”,展示其將語言連接到物理動作的能力。 >
    3. >協作雜貨處理:
    4. >該視頻突出顯示了兩個機器人,由一個單個螺旋實例控制,有效地存儲了多樣化的,陌生的雜貨店。 它們的協調性,包括物品交接和在抽屜/容器中的位置,由自然語言提示驅動(“手袋餅乾...”,“將其放在開放的抽屜中”)。 這證明了Helix的多機器人協作和零擊的概括功能。

    完整的上身電動機控制:

    該演示在200Hz時展示了Helix的35-DOF控制。 機器人可以平穩操縱物體,協調其整個上身(軀幹,頭部,手腕,手指),以獲得最佳的觸及和精度。 這突出了Helix的實時靈活性和穩定性,克服了與高DOF系統相關的挑戰。

    語言引導的對像操縱:

    摘要:

    >圖AI的螺旋代表了人形機器人技術中的一個顯著飛躍。它的創新VLA框架,以及其雙層系統體系結構和機上處理功能,可以實現類似人類的推理和靈活性,使其非常適合現實世界的應用程序,尤其是在家庭環境中。 Helix能夠理解和響應自然語言指示的能力,同時處理各種物體而沒有事先訓練的物體標誌著機器人技術領域的實質性變化。

以上是圖形的螺旋:將類似人類的機器人帶到您家的AI -Analytics Vidhya的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
作者最新文章
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板