Meta研究員創造出人工視覺皮層,讓機器人透過視覺進行操作
Meta公司AI研究部門的研究人員日前發布一項公告,宣佈在機器人自適應技能協調和視覺皮層複製方面取得關鍵進展。他們表示,這些進展允許AI驅動的機器人透過視覺在現實世界中操作,並且不需要取得現實世界的任何數據。
他們聲稱,這是在創建通用的「具象AI(Embodied AI)」機器人方面的一個重大進步,這種機器人能夠在沒有人類幹預的情況下與現實世界互動。研究人員還表示,他們創建了一種名為「VC-1」的人工視覺皮層,這個視覺皮層在Ego4D資料集上訓練,而Ego4D資料集來自全球各地的數千名研究參與者記錄日常活動的影片.
正如研究人員在之前發表的一篇部落格文章中解釋的那樣,視覺皮層是大腦中使生物能夠將視覺轉化為運動的區域。因此,對於任何需要根據眼前景象來執行任務的機器人來說,具備人工視覺皮層是一個關鍵要求。
由於「VC-1」的人工視覺皮層需要在各種環境中很好地執行一系列不同的感覺運動任務,Ego4D資料集發揮了特別重要的作用,因為它包含了研究參與者透過可穿戴攝影機記錄日常活動的數千小時視頻,這些活動包括烹飪、清潔、運動、手工製作等。
研究人員說:「生物有機體有一個通用的視覺皮層,這就是我們所尋找的具象代理。因此,我們開始創建一個在多個任務中表現良好的資料集,以Ego4D作為核心數據集,並透過添加額外的數據集來改進VC-1。由於Ego4D主要關注烹飪、園藝和手工製作等日常活動,我們還採用了探索房屋和公寓的以自我為中心的視頻數據集。」
然而,視覺皮層只是「具象AI」的一個元素,機器人要想在現實世界中完全自主地工作,還必須能夠操縱現實世界中的物體。機器人需要視覺進行導航,找到並搬運物體將它移動到另一個位置,然後正確放置——所有這些動作都是基於它所看到和聽到的情況自主實施。
為了解決這個問題,Meta的AI專家與佐治亞理工學院的研究人員合作開發了一種被稱為“自適應技能協調”(ASC)的新技術,機器人採用這種技術進行模擬訓練,然後將這些技能複製到現實世界的機器人身上。
Meta公司也與波士頓動力開展合作,展示了其ASC技術的有效性。這兩家公司將ASC技術與波士頓動力的Spot機器人結合,使其機器人具有強大的感測、導航和操作能力,儘管還需要大量的人工幹預。例如挑選一個物體,還需要有人點選機器人平板電腦上顯示的物體。
研究人員在文章中寫道:「我們的目標是建立一個可以透過波士頓動力API從機載感測和電機指令中感知世界的AI模型。」
Spot機器人機器人使用Habitat模擬器進行測試,其模擬環境採用HM3D和ReplicaCAD資料集構建,其中包含1000多個家庭的室內3D掃描資料。然後,訓練Spot機器人在一個它以前從未見過的房子裡活動,搬運物體,並將它們放在合適的位置。然後將受過訓練的Spot機器人所獲得的知識和資訊複製到在現實世界操作的Spot機器人上,這些機器人根據他們對房屋佈局的了解,自動執行同樣的任務。
研究人員寫道:「我們使用了一個185平方公尺的家具齊全的公寓和一個65平方公尺的大學實驗室這兩個截然不同的現實環境對Spot機器人進行測試,要求Spot機器人重新放置各種物品。總體而言,採用ASC技術的Spot機器人的表現近乎完美,在60次測試中成功了59次,克服了硬體不穩定、拾取故障以及移動障礙物或阻塞路徑等對抗性幹擾。」
Meta的研究人員表示,他們也開放了VC-1模型的源代碼,並在另一篇的論文中分享瞭如何縮放模型大小、資料集大小等方面的詳細情況。同時,團隊的下一個重點將是嘗試將VC-1與ASC集成,以創建一個更接近人類的具象AI系統。
以上是Meta研究員創造出人工視覺皮層,讓機器人透過視覺進行操作的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

DMA在C 中是指DirectMemoryAccess,直接內存訪問技術,允許硬件設備直接與內存進行數據傳輸,不需要CPU干預。 1)DMA操作高度依賴於硬件設備和驅動程序,實現方式因係統而異。 2)直接訪問內存可能帶來安全風險,需確保代碼的正確性和安全性。 3)DMA可提高性能,但使用不當可能導致系統性能下降。通過實踐和學習,可以掌握DMA的使用技巧,在高速數據傳輸和實時信號處理等場景中發揮其最大效能。

使用C 中的chrono庫可以讓你更加精確地控制時間和時間間隔,讓我們來探討一下這個庫的魅力所在吧。 C 的chrono庫是標準庫的一部分,它提供了一種現代化的方式來處理時間和時間間隔。對於那些曾經飽受time.h和ctime折磨的程序員來說,chrono無疑是一個福音。它不僅提高了代碼的可讀性和可維護性,還提供了更高的精度和靈活性。讓我們從基礎開始,chrono庫主要包括以下幾個關鍵組件:std::chrono::system_clock:表示系統時鐘,用於獲取當前時間。 std::chron

交易所內置量化工具包括:1. Binance(幣安):提供Binance Futures量化模塊,低手續費,支持AI輔助交易。 2. OKX(歐易):支持多賬戶管理和智能訂單路由,提供機構級風控。獨立量化策略平台有:3. 3Commas:拖拽式策略生成器,適用於多平台對沖套利。 4. Quadency:專業級算法策略庫,支持自定義風險閾值。 5. Pionex:內置16 預設策略,低交易手續費。垂直領域工具包括:6. Cryptohopper:雲端量化平台,支持150 技術指標。 7. Bitsgap:

在C 中處理高DPI顯示可以通過以下步驟實現:1)理解DPI和縮放,使用操作系統API獲取DPI信息並調整圖形輸出;2)處理跨平台兼容性,使用如SDL或Qt的跨平台圖形庫;3)進行性能優化,通過緩存、硬件加速和動態調整細節級別來提升性能;4)解決常見問題,如模糊文本和界面元素過小,通過正確應用DPI縮放來解決。

C 在實時操作系統(RTOS)編程中表現出色,提供了高效的執行效率和精確的時間管理。 1)C 通過直接操作硬件資源和高效的內存管理滿足RTOS的需求。 2)利用面向對象特性,C 可以設計靈活的任務調度系統。 3)C 支持高效的中斷處理,但需避免動態內存分配和異常處理以保證實時性。 4)模板編程和內聯函數有助於性能優化。 5)實際應用中,C 可用於實現高效的日誌系統。

C 中使用字符串流的主要步驟和注意事項如下:1.創建輸出字符串流並轉換數據,如將整數轉換為字符串。 2.應用於復雜數據結構的序列化,如將vector轉換為字符串。 3.注意性能問題,避免在處理大量數據時頻繁使用字符串流,可考慮使用std::string的append方法。 4.注意內存管理,避免頻繁創建和銷毀字符串流對象,可以重用或使用std::stringstream。

在C 中測量線程性能可以使用標準庫中的計時工具、性能分析工具和自定義計時器。 1.使用庫測量執行時間。 2.使用gprof進行性能分析,步驟包括編譯時添加-pg選項、運行程序生成gmon.out文件、生成性能報告。 3.使用Valgrind的Callgrind模塊進行更詳細的分析,步驟包括運行程序生成callgrind.out文件、使用kcachegrind查看結果。 4.自定義計時器可靈活測量特定代碼段的執行時間。這些方法幫助全面了解線程性能,並優化代碼。

在MySQL中,添加字段使用ALTERTABLEtable_nameADDCOLUMNnew_columnVARCHAR(255)AFTERexisting_column,刪除字段使用ALTERTABLEtable_nameDROPCOLUMNcolumn_to_drop。添加字段時,需指定位置以優化查詢性能和數據結構;刪除字段前需確認操作不可逆;使用在線DDL、備份數據、測試環境和低負載時間段修改表結構是性能優化和最佳實踐。
