當我還在跟ChatGPT聊天,有人已經開始用它來控制機器人工作了
你可曾想過用自己的話告訴機器人該做什麼,就像對人說話?
比如說,只要告訴你的家庭助理機器人「請幫我熱午餐」,然後它就能自己找到微波爐。很神奇,對嗎?
儘管語言是人類表達意圖的最直觀的方式,但此前很長一段時間,人們仍然嚴重依賴手寫程式碼來實現對機器人的控制。不過,當 ChatGPT 出現之後,這種情況就變一下了。
在最近的一項研究中,微軟團隊正在探索如何使用 OpenAI 的新 AI 語言模型 ChatGPT 來使自然的人機互動成為可能。
論文連結:https://www.microsoft.com/en-us/research/uploads/prod/ 2023/02/ChatGPT___Robotics.pdf
ChatGPT 是一個在大量文本和人類互動語料庫上訓練的語言模型,因此應對廣泛的prompt 和問題時,它可以產生連貫且語法正確的響應。這項研究的目標是看看 ChatGPT 是否可以超越文本思考,並對現實世界進行推理,以幫助機器人完成任務。研究者希望以此便利人們與機器人的互動,而不需要學習複雜的程式語言或機器人系統的細節。
研究的關鍵挑戰在於教會 ChatGPT:如何透過考慮物理定律、操作環境以及機器人運用肢體動作改變周圍環境的方式來解決問題。
事實證明,ChatGPT 本身可以做很多事情,但它仍然需要一些幫助。團隊在論文中描述了一系列可用於指導語言模型解決機器人任務的設計原則,包括(但不限於)特別 prompt 結構、高級 API 和透過人類文本回饋。研究者認為,這項工作只是開發機器人系統的轉變的開始,並且希望透過這項研究激勵其他研究人員加入這個有趣的研究領域。
當今機器人技術面臨的挑戰,以及ChatGPT 能提供的幫助
目前機器人的操作流程是從工程師或技術使用者開始,需要他們將任務需求轉換為系統程式碼。工程師會處於工作流程的迴路中,他們需要不斷編寫新的程式碼和規格來修正機器人的行為。總得來說,這個過程是緩慢的(使用者需要編寫低階程式碼)、昂貴的(需要對機器人技術有深入了解的高技能使用者)且低效的(需要多次互動才能正常運作)。
#但ChatGPT 開啟了一種新的機器人範式,並允許潛在的非技術型用戶參與到迴路之中,在監視機器人效能的同時向大型語言模型(LLM)提供高階回饋。透過遵循研究的設計原則,ChatGPT 可以為機器人場景產生程式碼。在沒有任何微調的情況下,研究利用 LLM 的知識來控制不同的機器人形狀,以完成各種任務。工作中,研究人員展示了多個 ChatGPT 解決機器人難題的範例,以及在操作、空中和導航領域的複雜機器人部署。
機器人與 ChatGPT:設計原則
#Prompting LLM 是一門高度實證的科學。研究透過反覆試驗建立了一套為機器人任務編寫prompt 的方法和設計原則:
- 首先,研究定義了一組高階機器人API 或函數庫。這個函式庫可以特定於特定的機器人,並且可以映射到機器人的控制堆疊或感知庫中現有的低階實現。對高級API 使用描述性名稱非常重要,這樣ChatGPT 就可以推斷它們的行為;
- 接下來,研究人員為ChatGPT 編寫一個文本prompt,它描述了任務目標,同時明確說明來自高級庫的哪些函數是可用的。 Prompt 還可以囊括關於任務約束的信息,或者ChatGPT 應該如何形成其答案(特定的編碼語言,使用輔助解析元素);
- 用戶在迴路中評估ChatGPT 的代碼輸出,要么通過直接檢查,要么使用模擬器。如果需要,使用者可以使用自然語言向 ChatGPT 回饋答案的品質和安全性。
用戶滿意解決方案的話,程式碼就可以最終部署到機器人上。
#理論已經夠多了,ChatGPT 到底能做什麼?
讓我們參考幾個例子,你也可以在程式碼庫中找到更多案例研究。
零樣本任務計畫
研究人員讓ChatGPT 控制真正的無人機,經證明,它是非技術使用者和機器人之間非常直覺的基於語言的介面。當使用者的指令含糊不清時,ChatGPT 會提出要明確化問題,並為無人機編寫複雜的程式碼結構以直觀地檢查架構,例如鋸齒形模式。它甚至學會了自拍!
#研究人員也使用Microsoft AirSim 模擬器在一個模擬工業檢驗場景中使用ChatGPT。該模型能夠有效地解析使用者的高階意圖和幾何線索,從而準確地控制無人機。
#在迴路中的使用者:當複雜的任務需要對話時
接下來,研究人員將ChatGPT 用於機械手臂的操作場景,並使用對話回饋來教導模型如何將最初提供的API 組合成更複雜的進階函數:ChatGPT 自動程式設計。該模型能夠使用課程本位策略,按照邏輯將學習到的技能連結在一起,以執行諸如堆疊塊等操作。
此外,當用木塊建立微軟標誌時,模型展示了一個連接文字和實體領域的完美範例。它不僅能夠從內部知識庫中回憶 logo,還能夠「繪製」logo(作為 SVG 程式碼),然後使用上面學到的技能來找出哪些現有的機器人動作可以構成其外形。
#接下來,研究人員讓ChatGPT 寫一個演算法,讓無人機在達到空中目標的同時不撞上障礙物。他們告訴模型,這架無人機有一個面向前方的距離感測器,ChatGPT 立即為演算法編寫了大部分關鍵構建塊。這項任務需要與人進行一些對話,ChatGPT 僅使用語言回饋就能進行在地化程式碼改進的能力令人印象深刻。
感知- 行動迴路:機器人在行動前感知世界
在做某事(行動)之前感知世界(感知)的能力是任何機器人系統的基礎。因此,研究人員決定測試 ChatGPT 對這個概念的理解,並要求它探索一個環境,直到找到使用者指定的物件。研究為模型提供了物件偵測和物件距離 API 等功能,並驗證了它產生的程式碼成功實現了感知 - 行動循環。
在實驗階段,研究者進行了額外的實驗,以評估ChatGPT 是否能夠根據感測器回饋即時決定機器人應該去哪裡(而不是讓ChatGPT 產生一個程式碼迴路來做出這些決定)。有趣的是,恰好驗證了可以在對話的每一步中輸入相機影像的文字描述,並且模型能夠弄清楚如何控制機器人,直到它到達特定的物件。
PromptCraft, LLM 機器人研究的協作開源工具
良好的Prompt 工程對於大型語言模型的成功至關重要,例如ChatGPT 用於機器人任務。可惜,Prompt 是一門實證科學,缺乏全面和可訪問的資源,其中能為該領域的研究人員和愛好者提供幫助的例子也是良莠不齊。為了彌合這一差距,研究者引入了「PromptCraft」,這是一個協作開源平台,任何人在這裡都可以分享不同機器人類別的Prompt 策略範例,而且,研究者公佈了在這項研究中使用的所有Prompt 和對話。
除了 Prompt 設計,研究還希望包含多個機器人模擬器和介面,讓使用者可以測試他們的 ChatGPT 產生的演算法。作為開始,研究還發布了一個與 ChatGPT 整合的 AirSim 環境,任何人都可以使用它來展開這些想法。
ChatGPT-AirSim 介面
讓機器人走出實驗室,走向世界
發布這些技術是一件值得慶祝的事,因為這會擴大機器人技術的受眾。微軟的研究人員相信,基於語言的機器人控制將會為讓機器人從科學實驗室走進日常用戶的生活奠定基礎。
本文要強調的是,在沒有仔細分析的情況下,ChatGPT 的輸出並不代表要直接部署在機器人上。研究者鼓勵使用者利用模擬的力量,以便在潛在的現實生活部署之前評估這些演算法,並始終採取必要的安全預防措施。本文所述的工作只代表了在機器人領域運作的大型語言模型的交集中可能實現的一小部分,希望能為更多的研究提供靈感。
原文連結:https://www.microsoft.com/en-us/research/group/autonomous-systems-group-robotics/articles/chatgpt-for-robotics/
以上是當我還在跟ChatGPT聊天,有人已經開始用它來控制機器人工作了的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

DALL-E 3 於 2023 年 9 月正式推出,是比其前身大幅改進的車型。它被認為是迄今為止最好的人工智慧圖像生成器之一,能夠創建具有複雜細節的圖像。然而,在推出時,它不包括

安裝步驟:1、在ChatGTP官網或手機商店下載ChatGTP軟體;2、開啟後在設定介面中,選擇語言為中文;3、在對局介面中,選擇人機對局並設定中文相譜;4 、開始後在聊天視窗中輸入指令,即可與軟體互動。

機器之能報道編輯:吳昕國內版的人形機器人+大模型組隊,首次完成疊衣服這類複雜柔性材料的操作任務。隨著融合了OpenAI多模態大模型的Figure01揭開神秘面紗,國內同行的相關進展一直備受關注。就在昨天,國內"人形機器人第一股"優必選發布了人形機器人WalkerS深入融合百度文心大模型後的首個Demo,展示了一些有趣的新功能。現在,得到百度文心大模型能力加持的WalkerS是這個樣子的。和Figure01一樣,WalkerS沒有走動,而是站在桌子後面完成一系列任務。它可以聽從人類的命令,折疊衣物

在工業自動化技術領域,最近有兩個熱點很難被忽視:人工智慧(AI)和英偉達(Nvidia)。不要改變原內容的意思,微調內容,重寫內容,不要續寫:「不僅如此,這兩者密切相關,因為英偉達在不僅僅局限於其最開始的圖形處理單元(GPU),正在將其GPU科技擴展到數位孿生領域,同時緊密連接著新興的AI技術。泰瑞達機器人及其MiR和優傲機器人公司。 Recently,Nvidiahascoll

人形機器人Ameca升級第二代了!最近,在世界行動通訊大會MWC2024上,世界上最先進機器人Ameca又現身了。會場周圍,Ameca引來一大波觀眾。得到GPT-4加持後,Ameca能夠對各種問題做出即時反應。 「來一段舞蹈」。當被問及是否有情感時,Ameca用一系列的面部表情做出回應,看起來非常逼真。就在前幾天,Ameca背後的英國機器人公司EngineeredArts剛剛示範了團隊最新的開發成果。影片中,機器人Ameca具備了視覺能力,能看見並描述房間整個狀況、描述具體物體。最厲害的是,她還能

這週,由OpenAI、微軟、貝佐斯和英偉達投資的機器人公司FigureAI宣布獲得接近7億美元的融資,計劃在未來一年內研發出可獨立行走的人形機器人。而特斯拉的擎天柱也屢屢傳出好消息。沒人懷疑,今年會是人形機器人爆發的一年。一家位於加拿大的機器人公司SanctuaryAI最近發布了一款全新的人形機器人Phoenix。官方號稱它能以和人類一樣的速率自主完成許多工作。世界上第一台能以人類速度自主完成任務的機器人Pheonix可以輕輕地抓取、移動並優雅地將每個物件放置在它的左右兩側。它能夠自主辨識物體的

一眨眼的功夫,機器人都已經學會變魔術了?只見它先是拿起桌上的水勺,向觀眾證明了裡面什麼也沒有……然後,它又把手中雞蛋似的物體放了進去,然後把水勺放回桌子上,開始「施法」… …就在它把水勺再次拿起的時候,奇蹟發生了。原先放進去的雞蛋不翼而飛,跳出的東西變成了一個籃球……再來看一遍連貫動作:△此動圖為二倍速一套動作下來如行雲流水,只有把視頻用0.5倍速反复觀看,才終於發現其中的端倪了:如果手速再快一些,大概真的就可以瞞天過海了。有網友感嘆,機器人變魔術的程度比自己還要高:為我們表演這段魔術的,是Mag

近幾年最受消費者歡迎的智慧家電,掃拖機器人可謂是其中之一。它所帶來的操作便利性,甚至是無需操作,讓懶人們釋放了雙手,讓消費者能夠從日常的家務中「解放」出來,也能拿更多的時間花在自己喜歡的事情上,變相提高了生活品質。藉著這股熱潮,市面上幾乎所有的家電產品品牌都在做自己的掃拖機器人,一時間使得整個掃拖機器人市場熱鬧非凡。但市場的快速拓張必然會帶來一個隱患:很多廠商會採用機海戰術的方式快速佔領更多的市場份額,從而導致很多新品並沒有什麼升級點,說它是“套娃”機型也不為過。不過,並不是所有的掃拖機器人都是
