復旦NLP團隊發表80頁大模型Agent綜述,一文綜觀AI智能體的現況與未來
論文連結:https://arxiv.org/pdf/2309.07864.pdf LLM -based Agent 論文清單:https://github.com/WooooDyy/LLM-Agent-Paper-List
控制端:通常由 LLMs 構成,是智慧代理的核心。它不僅可以儲存記憶和知識,還承擔資訊處理、決策等不可或缺的功能。它可以呈現推理和計劃的過程,並很好地應對未知任務,反映出智慧代理的泛化性和遷移性。 感知端:將智慧代理的感知空間從純文字拓展到包括文字、視覺和聽覺等多模態領域,使代理人能夠更有效地從周圍環境中獲取與利用資訊。 行動端:除了常規的文本輸出,還賦予代理具身能力、使用工具的能力,使其能夠更好地適應環境變化,透過回饋與環境交互,甚至能塑造環境。
高品質文字生成:大量評估實驗表明,LLMs 能夠產生流暢、多樣、新穎、可控制的文字。儘管在個別語言上表現欠佳,但整體上具備良好的多語言能力。 言下之意的理解:除了直覺表現出的內容,語言背後可能也傳遞了說話者的意圖、偏好等訊息。言下之意有助於代理更有效率地溝通與合作,大模型展現了這方面的潛力。
擴充Backbone 架構的長度限制:針對Transformers 固有的序列長度限制問題進行改進。 總結記憶(Summarizing):對記憶進行摘要總結,增強代理人從記憶中提取關鍵細節的能力。 壓縮記憶(Compressing):透過使用向量或適當的資料結構對記憶進行壓縮,可以提高記憶檢索效率。
#計畫制定(Plan Formulation):代理人將複雜任務分解為更容易管理的子任務。例如:一次性分解再依序執行、逐步規劃並執行、多路規劃並選取最優路徑等。在一些需要專業知識的場景中,代理可與特定領域的 Planner 模組集成,提升能力。 計畫反思(Plan Reflection):在製定計劃後,可以進行反思並評估其優劣。這種反思一般來自三個面向:借助內在回饋機制;與人類互動獲得回饋;從環境中獲得回饋。
#對未知任務的泛化:隨著模型規模與訓練資料的增大,LLMs 在解決未知任務上湧現了驚人的能力。通过指令微调的大模型在 zero-shot 测试中表现良好,在许多任务上都取得了不亚于专家模型的成绩。 情景学习(In-context Learning):大模型不仅能够从上下文的少量示例中进行类比学习,这种能力还可以扩展到文本以外的多模态场景,为代理在现实世界中的应用提供了更多可能性。 持续学习(Continual Learning):持续学习的主要挑战是灾难性遗忘,即当模型学习新任务时容易丢失过往任务中的知识。专有领域的智能代理应当尽量避免丢失通用领域的知识。
将视觉输入转为对应的文本描述(Image Captioning):可以被 LLMs 直接理解,并且可解释性高。 对视觉信息进行编码表示:以视觉基础模型 LLMs 的范式来构成感知模块,通过对齐操作来让模型理解不同模态的内容,可以端到端的方式进行训练。
Observation 可以幫助智慧代理在環境中定位自身位置、感知物件物品和獲取其他環境資訊; Manipulation 則是完成一些具體的抓取、推動等操作任務; -
Navigation 要求智慧代理根據任務目標變換自身位置並根據環境資訊更新自身狀態。
##1 . 幫助使用者從日常任務、重複勞動中解脫出來,減輕人類的工作壓力,提高解決任務的效率;
在這個基礎上,代理人的應用可以有三個範式:
單一代理程式場景
在任務導向的部署中,代理人幫助人類使用者處理日常基本任務。它們需要具備基本的指令理解、任務分解、與環境互動的能力。具體來說,根據現有的任務類型,代理的實際應用又可分為模擬網路環境與模擬生活場景。 在創新導向的部署中,代理人能夠在前沿科學領域展現出自主探究的潛力。雖然來自專業領域的固有複雜性和訓練資料的缺乏為智慧代理的建構帶來了阻礙,但目前已經有許多工作在化學、材料、電腦等領域取得了進展。 在生命週期導向的部署中,代理商具備在一個開放世界中不斷探索、學習和使用新技能,並長久生存的能力。在本節中,作者們以《我的世界》遊戲為例展開介紹。由於遊戲中的生存挑戰可以被認為是現實世界的縮影,已經有許多研究者將其作為開發和測試代理綜合能力的獨特平台。
當所有代理人自由地表達自己的觀點、看法,以一種沒有順序的方式進行合作時,稱為無序合作。 當所有代理人遵循一定的規則,例如以流水線的形式逐一發表自己的觀點時,整個合作過程井然有序,稱為有序合作。
Instructor-Executor 模式:人類作為指導者,給予指令、回饋意見;而代理人作為執行者,依據指示逐步調整、優化。這種模式在教育、醫療、商業等領域得到了廣泛的應用。 Equal Partnership 模式:有研究觀察到代理人能夠在與人類的溝通中表現出共感能力,或是以平等的身分參與任務執行中。智能代理展現出在日常生活中的應用潛力,並有望在未來融入人類社會。
左側部分:在個體層面上,代理人表現出多種內化行為,例如計劃、推理和反思。此外,代理人也顯現出內在的人格特徵,涵蓋認知、情緒和性格三個面向。 中間部分:單一代理人可以與其他代理個體組成群體,共同展現出合作等群體行為,例如協同合作等。 右邊部分:環境的形式可以是虛擬的沙盒環境,也可以是真實的物理世界。環境中的要素包括了人類參與者和各類可用資源。對於單一代理而言,其他代理也屬於環境的一部分。 整體互動:代理人們透過感知外界環境、採取行動,積極參與整個互動過程。
- ##文章從外在行為和內在人格來審視了代理人在社會中的表現:
- 社會行為: 從社會的角度出發,行為可以分為個體和集體兩個層次:
- 人格: 包含認知、情感和性格。就像人類在社會化過程中逐漸形成自己的特質一樣,代理也展現了所謂的 "類人智能",即透過與群體和環境的互動中逐漸塑造人格。
認知(Cognitive abilities):涵蓋了代理獲取和理解知識的過程,研究表明,基於LLM 的代理在某些方面能夠表現出類似於人類的深思熟慮和智力水平。
性格(Character portrayal):為了理解和分析LLMs 的性格特徵,研究人員利用了成熟的評測方式,如大五人格、MBTI 測試,以探究性格的多樣性和複雜性。
- 基於文本的環境:
- 由於LLMs 主要依賴語言作為其輸入和輸出格式,因此基於文字的環境是代理最自然的操作平台。透過文字的方式來描述社會現象和互動,文本環境提供了語義和背景知識。代理存在於這樣的文本世界中,依賴文本資源來感知、推理和採取行動。
- 虛擬沙盒環境: 在電腦領域,沙盒是指一種可受控且隔離的環境,常用於進行軟體測試和病毒分析。而代理社會的虛擬沙盒環境則是作為模擬社會互動和行為模擬的平台,其主要特徵包括:
以上是復旦NLP團隊發表80頁大模型Agent綜述,一文綜觀AI智能體的現況與未來的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

熱門話題

同樣是圖生視頻,PaintsUndo走出了不一樣的路線。 ControlNet作者LvminZhang又開始整活了!這次瞄準繪畫領域。新項目PaintsUndo剛上線不久,就收穫1.4kstar(還在瘋狂漲)。項目地址:https://github.com/lllyasviel/Paints-UNDO透過這個項目,用戶輸入一張靜態圖像,PaintsUndo就能自動幫你生成整個繪畫的全過程視頻,從線稿到成品都有跡可循。繪製過程,線條變化多端甚是神奇,最終視頻結果和原始圖像非常相似:我們再來看一個完整的繪

AIxiv專欄是本站發布學術、技術內容的欄位。過去數年,本站AIxiv專欄接收通報了2,000多篇內容,涵蓋全球各大專院校與企業的頂尖實驗室,有效促進了學術交流與傳播。如果您有優秀的工作想要分享,歡迎投稿或聯絡報道。投稿信箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com這篇論文的作者皆來自伊利諾大學香檳分校(UIUC)張令明老師團隊,包括:StevenXia,四年級博士生,研究方向是基於AI大模型的自動代碼修復;鄧茵琳,四年級博士生,研究方

AIxiv專欄是本站發布學術、技術內容的欄位。過去數年,本站AIxiv專欄接收通報了2,000多篇內容,涵蓋全球各大專院校與企業的頂尖實驗室,有效促進了學術交流與傳播。如果您有優秀的工作想要分享,歡迎投稿或聯絡報道。投稿信箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com在人工智慧領域的發展過程中,對大語言模型(LLM)的控制與指導始終是核心挑戰之一,旨在確保這些模型既強大又安全地服務人類社會。早期的努力集中在透過人類回饋的強化學習方法(RL

如果AI模型給的答案一點也看不懂,你敢用嗎?隨著機器學習系統在更重要的領域中得到應用,證明為什麼我們可以信任它們的輸出,並明確何時不應信任它們,變得越來越重要。獲得對複雜系統輸出結果信任的一個可行方法是,要求系統對其輸出產生一種解釋,這種解釋對人類或另一個受信任的系統來說是可讀的,即可以完全理解以至於任何可能的錯誤都可以被發現。例如,為了建立對司法系統的信任,我們要求法院提供清晰易讀的書面意見,解釋並支持其決策。對於大型語言模型來說,我們也可以採用類似的方法。不過,在採用這種方法時,確保語言模型生

乾杯!當論文討論細緻到詞句,是什麼體驗?最近,史丹佛大學的學生針對arXiv論文創建了一個開放討論論壇——alphaXiv,可以直接在任何arXiv論文之上發布問題和評論。網站連結:https://alphaxiv.org/其實不需要專門訪問這個網站,只需將任何URL中的arXiv更改為alphaXiv就可以直接在alphaXiv論壇上打開相應論文:可以精準定位到論文中的段落、句子:右側討論區,使用者可以發表問題詢問作者論文想法、細節,例如:也可以針對論文內容發表評論,例如:「給出至

最近,被稱為千禧年七大難題之一的黎曼猜想迎來了新突破。黎曼猜想是數學中一個非常重要的未解決問題,與素數分佈的精確性質有關(素數是那些只能被1和自身整除的數字,它們在數論中扮演著基礎性的角色)。在當今的數學文獻中,已有超過一千個數學命題以黎曼猜想(或其推廣形式)的成立為前提。也就是說,黎曼猜想及其推廣形式一旦被證明,這一千多個命題將被確立為定理,對數學領域產生深遠的影響;而如果黎曼猜想被證明是錯誤的,那麼這些命題中的一部分也將隨之失去其有效性。新的突破來自MIT數學教授LarryGuth和牛津大學

把因果鏈展示給LLM,它就能學會公理。 AI已經在幫助數學家和科學家做研究了,例如著名數學家陶哲軒就曾多次分享自己借助GPT等AI工具研究探索的經驗。 AI要在這些領域大戰拳腳,強大可靠的因果推理能力是不可或缺的。本文要介紹的研究發現:在小圖譜的因果傳遞性公理演示上訓練的Transformer模型可以泛化用於大圖譜的傳遞性公理。也就是說,如果讓Transformer學會執行簡單的因果推理,就可能用於更複雜的因果推理。該團隊提出的公理訓練框架是一種基於被動資料來學習因果推理的新範式,只有演示

AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com。引言近年来,多模态大型语言模型(MLLM)在各个领域的应用取得了显著的成功。然而,作为许多下游任务的基础模型,当前的MLLM由众所周知的Transformer网络构成,这种网
