Agent像人一樣分工協作,還能「群組聊天」交換訊息
智能體也要有「規範手冊」!
一項名為MetaGPT的研究,透過對智能體角色進行明確分工,並要求多個智能體在協作中採用統一規範的「交流格式」等方法,讓智能體性能大增。
目前,這項研究在GitHub上已狂攬33.6k星,並在深度學習頂會ICLR 2024上被收錄為Oral論文。
總的來說,MetaGPT是模仿人類的分工協作方式,將各種任務的標準作業流程編碼為智能體的「規範手冊”,不同角色的智能體負責不同的專業任務。
例如產品經理角色可以使用網路搜尋工具,而工程師角色可以執行程式碼:
#由此多智能體協作完成任務。
研究人員為智能體們設定了一個“訊息共享群”,智能體可以自由查看其他智能體發送的相關訊息。
經過測試,使用此方法,在程式碼補全任務的公開資料集HumanEval和MBPP上,MetaGPT分別取得了85.9%和87.7%的新SOTA。
目前這項工作已開源,在全網受到不少網友關注:
#MetaGPT長啥樣?
這項研究由DeepWisdom團隊聯合KAUST AI中心、廈門大學、CUHK(SZ)、南京大學、UPenn以及UCB等眾多大學機構的學者共同提出。
隨著大模型能力的不斷提升,基於大模型的智能體來解決各種任務在學術界和工業界的興趣日益增長。
值得注意的是,採用多個智能體協作解決特定領域問題的研究仍處於早期階段。現有研究主要集中在透過角色扮演機制和溝通拓樸設定來增強任務理解和推理決策能力。儘管取得了一定進展,但這些方法仍然依賴直接的對話形式,缺乏智能體行為的標準規範和約束。
近期的一些工作也指出,基於對話形式的多智能體系統可能面臨資訊不一致、歧義以及可能的無效重複和無限循環等問題。
相較之下,人類工作流程中的標準作業流程(SOPs)不僅明確定義了參與角色的分工和拓樸結構,也建立了角色產出結果的標準規範。
研究表明,明確定義的SOPs可以提高任務執行的一致性和準確性,確保最終結果符合規定的品質標準。因此,為解決多智能體協作中的挑戰,研究人員設計了基於大模型的智慧體元程式框架MetaGPT。
MetaGPT要求智能體以專家形式參與協作,並依要求產生結構化的輸出,例如高品質的需求文件、架構設計圖和流程圖等。
結構化的輸出對於單一智能體即是更高層次的思維鏈(Chain-of-Thought),對於下游角色則是語意清晰、目標明確的脈絡(Context)。
在MetaGPT的框架中,研究人員將SOPs的概念對齊至角色專業化、通訊協定設計以及迭代式的可執行回饋設計。
角色專業化
透過明確定義的角色分工,複雜的工作得以分解為更小、更具體的任務。
如下圖所示,不同專業的角色,初始化為不同的目標和約束,以及不同的專業技能。如產品經理角色可以使用網路搜尋工具,而工程師角色可以執行程式碼。同時,每個角色都預設遵循ReAct的行為模式。
角色專業化使得每個智能體能夠專注於其領域內的具體任務,從而提升了大模型的輸出品質。
對於軟體開發而言,透過角色的流轉,這種分工更巧妙地完成了從自然語言到程式語言的對齊。論文中的角色消融實驗進一步證明了這一部分的效果。
通訊協定設計
在實際應用中,自然語言雖然具備語意的豐富性,但由於其非結構化的特性,在訊息傳遞過程中常常會導致訊息的扭曲甚至重要內容的遺失。
為解決這個問題,作者約束智能體以結構化的輸出(包括文件和圖表)參與協作,來提高資訊的清晰度和完整性。為驗證此設計,作者設計了多種軟體開發任務,透過產生程式碼的可執行性以及生產力指標強調結構化輸出在協作中的關鍵性。
在多智能體協作過程中,為提高通訊效率,MetaGPT引入了基於訊息共享的發布-訂閱機制(Publish-Subscribe Mechanism)。
如上圖所示,共享訊息集允許直接交換訊息,任何智慧體都可以透明地存取來自其他智慧體的訊息,無需詢問並等待回應。訂閱機制使智能體更傾向於接收與自我任務相關的訊息,避免分心於不相關的細節。同時,每個智能體可直接從共享訊息池檢索所需訊息,形成自我記憶。
可執行回饋
智能體根據環境回饋進行自我優化和主動更新,是智能體具備自主意識的表現。
在軟體開發任務上,MetaGPT為工程師的智能體設計了可執行回饋機制,以進行程式碼品質自動最佳化。
具體而言,工程師編寫並執行對應的單元測試案例,透過觀察到的執行結果,遞歸地進行決策和自我提示,實現自動debug。這種設計-測試-回饋的迭代過程持續進行,直到單元測試通過或達到最大重試次數。
多個基準測試新SOTA
在程式碼產生能力上,研究人員採用了兩個公開基準資料集:HumanEval和MBPP,並報告Pass@1指標。
另外,他們還收集了涵蓋70個典型軟體開發任務(如迷你遊戲、資料視覺化、影像處理等)的資料集SoftwareDev,並進行了多個智能體開源框架的對比,對多個軟體開發任務的可執行性和生產效率進行了統計分析和定性說明。
如下圖所示,MetaGPT在HumanEval和MBPP基準測試中均優於先前的方法,分別達到了85.9%和87.7%。相較於GPT-4的結果,MetaGPT在HumanEval資料集上相對提升了28.2%,而加入可執行回饋機制分別在HumanEval和MBPP上提升了4.2%和5.4%。
在具有挑戰性的SoftwareDev資料集上,MetaGPT在可執行性上的得分為3.75,非常接近4,而所需的運行時間較短(503秒);產生的程式碼行數相對基線框架增加了2.24倍,而單位程式碼行數所消耗的token數下降了50%。
這些結果突顯了多智能體協作過程中SOPs帶來的效率提升。
MetaGPT在軟體開發任務中的高可執行性和相對較短的運行時間表明了其在實際應用中的實用性和效率。
聚焦在軟體開發領域,研究人員提供了不同智能體框架能力的質性對比。
他們發現,MetaGPT不僅具備多種模態的文件生成能力,也是目前眾多框架中唯一完整覆蓋了真實世界中軟體開發過程的開源框架。
總的來說,MetaGPT是一個新穎的多智能體框架,結合元程式設計思想,嵌入SOPs來增強大模型在多智能體協作上的能力。
透過角色專業化,工作流程管理和靈活的訊息機制,使其成為通用性和可移植性高的多智能體框架。
結合迭代式的回饋機制,MetaGPT在多個基準測試上取得SOTA效能。
結合人類社會實踐的SOPs,啟發了未來對於多智能體社會的研究和探索,也可視為對基於大模型的多智能體框架進行調節的早期嘗試。
論文連結:https://arxiv.org/abs/2308.00352
程式碼連結:https://github.com/geekan/MetaGPT
以上是Agent像人一樣分工協作,還能「群組聊天」交換訊息的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

0.這篇文章乾了啥?提出了DepthFM:一個多功能且快速的最先進的生成式單目深度估計模型。除了傳統的深度估計任務外,DepthFM還展示了在深度修復等下游任務中的最先進能力。 DepthFM效率高,可以在少數推理步驟內合成深度圖。以下一起來閱讀這項工作~1.論文資訊標題:DepthFM:FastMonocularDepthEstimationwithFlowMatching作者:MingGui,JohannesS.Fischer,UlrichPrestel,PingchuanMa,Dmytr

想像一下,一個人工智慧模型,不僅擁有超越傳統運算的能力,還能以更低的成本實現更有效率的效能。這不是科幻,DeepSeek-V2[1],全球最強開源MoE模型來了。 DeepSeek-V2是一個強大的專家混合(MoE)語言模型,具有訓練經濟、推理高效的特點。它由236B個參數組成,其中21B個參數用於啟動每個標記。與DeepSeek67B相比,DeepSeek-V2效能更強,同時節省了42.5%的訓練成本,減少了93.3%的KV緩存,最大生成吞吐量提高到5.76倍。 DeepSeek是一家探索通用人工智

AI,的確正在改變數學。最近,一直十分關注這個議題的陶哲軒,轉發了最近一期的《美國數學學會通報》(BulletinoftheAmericanMathematicalSociety)。圍繞著「機器會改變數學嗎?」這個話題,許多數學家發表了自己的觀點,全程火花四射,內容硬核,精彩紛呈。作者陣容強大,包括菲爾茲獎得主AkshayVenkatesh、華裔數學家鄭樂雋、紐大電腦科學家ErnestDavis等多位業界知名學者。 AI的世界已經發生了天翻地覆的變化,要知道,其中許多文章是在一年前提交的,而在這一

本月初,來自MIT等機構的研究者提出了一種非常有潛力的MLP替代方法—KAN。 KAN在準確性和可解釋性方面表現優於MLP。而且它能以非常少的參數量勝過以更大參數量運行的MLP。例如,作者表示,他們用KAN以更小的網路和更高的自動化程度重現了DeepMind的結果。具體來說,DeepMind的MLP有大約300,000個參數,而KAN只有約200個參數。 KAN與MLP一樣具有強大的數學基礎,MLP基於通用逼近定理,而KAN基於Kolmogorov-Arnold表示定理。如下圖所示,KAN在邊上具

波士頓動力Atlas,正式進入電動機器人時代!昨天,液壓Atlas剛「含淚」退出歷史舞台,今天波士頓動力就宣布:電動Atlas上崗。看來,在商用人形機器人領域,波士頓動力是下定決心要跟特斯拉硬剛一把了。新影片放出後,短短十幾小時內,就已經有一百多萬觀看。舊人離去,新角色登場,這是歷史的必然。毫無疑問,今年是人形機器人的爆發年。網友銳評:機器人的進步,讓今年看起來像人類的開幕式動作、自由度遠超人類,但這真不是恐怖片?影片一開始,Atlas平靜地躺在地上,看起來應該是仰面朝天。接下來,讓人驚掉下巴

特斯拉機器人Optimus最新影片出爐,已經可以在工廠裡打工了。正常速度下,它分揀電池(特斯拉的4680電池)是這樣的:官方還放出了20倍速下的樣子——在小小的「工位」上,揀啊揀啊揀:這次放出的影片亮點之一在於Optimus在廠子裡完成這項工作,是完全自主的,全程沒有人為的干預。而且在Optimus的視角之下,它還可以把放歪了的電池重新撿起來放置,主打一個自動糾錯:對於Optimus的手,英偉達科學家JimFan給出了高度的評價:Optimus的手是全球五指機器人裡最靈巧的之一。它的手不僅有觸覺

寫在前面項目連結:https://nianticlabs.github.io/mickey/給定兩張圖片,可以透過建立圖片之間的對應關係來估計它們之間的相機姿態。通常,這些對應關係是二維到二維的,而我們估計的姿態在尺度上是不確定的。一些應用,例如隨時隨地實現即時增強現實,需要尺度度量的姿態估計,因此它們依賴外部的深度估計器來恢復尺度。本文提出了MicKey,這是一個關鍵點匹配流程,能夠夠預測三維相機空間中的度量對應關係。透過學習跨影像的三維座標匹配,我們能夠在沒有深度測試的情況下推斷度量相對

什麼?瘋狂動物城被國產AI搬進現實了?與影片一同曝光的,是一款名為「可靈」全新國產影片生成大模型。 Sora利用了相似的技術路線,結合多項自研技術創新,生產的影片不僅運動幅度大且合理,還能模擬物理世界特性,具備強大的概念組合能力與想像。數據上看,可靈支持生成長達2分鐘的30fps的超長視頻,分辨率高達1080p,且支援多種寬高比。另外再劃個重點,可靈不是實驗室放出的Demo或影片結果演示,而是短影片領域頭部玩家快手推出的產品級應用。而且主打一個務實,不開空頭支票、發布即上線,可靈大模型已在快影
