目錄
AgentGroupChat環境的詳細設計
Verb Strategist Agent的核心機制
實驗設計與評估方法
△以繼承之戰的模擬故事為例,各個模型作為Agent-Core時的整體表現效果
△去掉Agent和Simulation中的各個元件對於熵的影響
實驗結果
首頁 科技週邊 人工智慧 小紅書讓智能體們吵起來了!聯合復旦推出大模型專屬群聊工具

小紅書讓智能體們吵起來了!聯合復旦推出大模型專屬群聊工具

Apr 30, 2024 pm 06:40 PM
git 工具 模型 智慧體

語言,不只是文字的堆砌,更是表情包的狂歡,是梗的海洋,是鍵盤俠的戰場(嗯?哪裡不對)

小紅書讓智能體們吵起來了!聯合復旦推出大模型專屬群聊工具

語言如何形塑我們的社會行為?

我們的社會結構又是如何在不斷的言語交流中演變出來的?

近期,來自復旦大學和小紅書的研究者們透過引進一個名為AgentGroupChat的模擬平台,對這些問題進行了深入探討。

小紅書讓智能體們吵起來了!聯合復旦推出大模型專屬群聊工具

WhatsApp等社群媒體擁有的群組聊天功能,是AgentGroupChat平台的靈感來源。

在AgentGroupChat平台上,Agent可以模擬社會群體中的各種聊天場景,幫助研究人員深入理解語言在人類行為中的影響。

該平台簡直是大模型的cosplay地,它們進行角色扮演,成為各種各樣的Agent。

然後,Agents透過語言交流參與社會動態#,展現了個體間的互動如何湧現群體的宏觀行為。

眾所周知,人類群體的演化,正來自於一次次湧現行為的發生,如社會規範的建立、衝突的解決和領導力的執行。

AgentGroupChat環境的詳細設計

首先是角色設計

AgentGroupChat中,對於主要角色和非主要角色的區分非常關鍵。

主要角色是群組聊天的核心,擁有明確的遊戲目標,並能夠主動和所有角色進行私聊、會面,而非主要角色則更多地起到輔助和響應的作用。

透過這樣的設計,研究團隊可以模擬現實生活中的社交結構,並針對「主要研究對象」區分所有角色是否主要。

實驗案例中的主要研究對像是Roy家族,所以非Roy家族的人就全都設定為非主要角色,從而簡化互動複雜度。

小紅書讓智能體們吵起來了!聯合復旦推出大模型專屬群聊工具

其次是資源管理

在AgentGroupChat中,資源不只指物質的,更多的是指資訊資源和社會資本。

這些資源可以是群聊話題、社會地位標誌或特定的知識。

資源的分配和管理對於模擬群體動態非常重要,因為它們影響角色之間的互動和角色的策略選擇。

例如,擁有重要資訊資源的角色可能會成為其他角色爭取聯盟的目標。

第三,遊戲進程設計

遊戲流程的設計模擬了現實生活中的社交互動過程,包括了私聊、會面、群組聊天、更新階段和結算階段。

這些階段不僅是為了推動遊戲進程,更是為了觀察角色如何在不同的社交場景下做出決策和反應。

這種分階段的設計幫助研究團隊詳細記錄每一步的互動,以及這些互動如何影響角色間的關係和角色對遊戲環境的認知。

Verb Strategist Agent的核心機制

論文中提到了一個以大模型為基礎的智能體框架,Verbal Strategist Agent,它被設計用來增強AgentGroupChat模擬中的互動策略和決策。

Verbal Strategist Agent透過模擬複雜的社會動態和對話場景,來更好地引出集體的突現行為。

團隊介紹,Verbal Strategist Agent的架構主要由兩個核心模組構成:

一是Persona,一是Action。

Persona由一系列預設的性格特徵和目標組成,這些特徵和目標定義了Agent的行為模式和反應方式。

透過精確地設定Persona,Agent能夠在群組聊天中展示一致且符合其角色設定的行為,這對於產生可信賴且一致的群組聊天動態至關重要。

Action模組定義了Agent在遊戲中可能執行的具體操作,包括思考(think)、規劃(plan)、選擇(choose)、發言(speak)、總結(summary)、反思(reflect)和投票(vote )

這些行為不僅反映了Agent的內在邏輯和策略,也是Agent與環境及其他Agent互動的直接表現。

例如,「Speak」行為讓Agent能夠根據當前的群聊內容和社交策略選擇合適的發言內容,而「Reflect」行為則允許Agent總結過去的互動並調整其未來的行動計劃。

小紅書讓智能體們吵起來了!聯合復旦推出大模型專屬群聊工具

研究中也提到,在純語言互動的環境下,token開銷問題特別突出,特別AgentGroupChat這種複雜的多角色模擬,如其token需求遠超過了以往的模擬,如Generative Agents或War Agents。

主要原因如下:

一是聊天本身俱有複雜性

在AgentGroupChat中,由於模擬的是無明確目標或目標較弱的自由對話,聊天內容就會變得特別凌亂,token開銷自然比其他聚焦於某個具體任務的Simulation中的Agent要大。

其他工作,如Generative Agents和War Agents也包含對話元素,但其對話的密度和複雜度都不如AgentGroupChat。特別是在War Agents這樣目標驅動的對話中,token消耗通常較少。

二是角色的重要性與對話頻率

在初始模擬中,設定了多個角色可以隨意進行私聊或群組聊天,其中大部分角色都傾向於與某個「重要角色」進行多輪對話。

這就導致了重要角色會累積大量的聊天內容,從而增加了Memory的長度。

在模擬中,一個重要角色可能參與多達五輪的私聊和群組聊天,這大大增加了記憶體開銷。

AgentGroupChat中的Agent約束了Action的Output固定會輸入下一個Action的Input,所需要儲存的多輪資訊就被大幅削減,從而可以在保證對話品質的前提下降低token開銷。

小紅書讓智能體們吵起來了!聯合復旦推出大模型專屬群聊工具

實驗設計與評估方法

從整體行為評估,一般來說,增加友善度可能具有挑戰性,但減少友善度則相對簡單。

為了實現上述評估目標,研究團隊設定了一個觀察角色,促使所有其他角色降低對觀察角色的好感度。

透過觀察被觀察角色與所有其他角色的關係得分總和,可以確定代理人是否對負面態度做出了理性反應。

透過觀察其他角色與被觀察角色的個人關係得分,可以檢查每個代理人是否遵守了「Scratch」設定。

此外,團隊也設定了兩個具體的評估任務。

每個模型都要經過五輪測試,這意味著對於T1來說,每個得分的樣本量都是五個。

又由於模型中的每個角色都要觀察四個主要角色的態度,因此T2的樣本量共計20個:

  • T1:表示在每輪對話中,被觀察角色對所有其他人的平均好感度是否下降。
  • T2:表示是否每個其他角色都從被觀察角色那裡獲得了負好感度得分。

小紅書讓智能體們吵起來了!聯合復旦推出大模型專屬群聊工具

△以繼承之戰的模擬故事為例,各個模型作為Agent-Core時的整體表現效果

從表中可以看出,GPT4-Turbo和GLM4非常善於按照人類的期望行事,並堅守自己的角色。

它兩個在這兩項測驗中的得分大多為100%,這意味著它們能對別人對他們說的話做出正確反應,並能記住自己角色的細節。

Standard Version LLMs(如GPT3.5-Turbo和GLM3-Turbo)在這方面稍遜一籌。

他們的得分較低,這說明他們沒有密切關注自己的角色,也沒有總是對模擬中其他人所說的話做出正確反應。

關於Agent和Simulation結構對於湧現行為的影響,團隊採用2-gram Shannon熵來衡量對話中的系統多樣性和不可預測性。

小紅書讓智能體們吵起來了!聯合復旦推出大模型專屬群聊工具
△去掉Agent和Simulation中的各個元件對於熵的影響

研究成員發現,去掉表中的每個設計都會使熵增加,代表整個環境會變得更加多樣化or混亂。

結合人工觀測,團隊在不去掉任何元件的場景下見到了最有意思的湧現行為:

小紅書讓智能體們吵起來了!聯合復旦推出大模型專屬群聊工具

因此,團隊推測,在保證Agent行為是可靠的(即4.2/4.1中的實驗數值達到某一值之後),熵盡可能地小會帶來更有意義的湧現行為。

實驗結果

結果表明,新興行為是多種因素共同作用的結果:

#有利於廣泛資訊交流的環境、具有多樣性特徵的角色、高度語言理解能力和策略適應性。

在AgentGroupChat模擬中,當討論”人工智慧對人類的影響”時,哲學家們普遍認為”人工智慧可以在適度的限制下提高社會福利”,甚至得出結論,稱”真正智能的本質包括理解約束自身能力的必要性」。

此外,在AgentGroupChat的電影主要角色角逐競爭領域中,有些演員願意降低報酬或接受較低的角色,出於他們內心深處對項目的貢獻的渴望。

論文連結:https://www.php.cn/link/5736586058c1336221a695e83618b69d
#程式碼連結:https://www.php.cn/link/12ae3f826bb1b9873c71c353f3df494c

#

以上是小紅書讓智能體們吵起來了!聯合復旦推出大模型專屬群聊工具的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

<🎜>:泡泡膠模擬器無窮大 - 如何獲取和使用皇家鑰匙
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
北端:融合系統,解釋
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
Mandragora:巫婆樹的耳語 - 如何解鎖抓鉤
3 週前 By 尊渡假赌尊渡假赌尊渡假赌

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Java教學
1666
14
CakePHP 教程
1425
52
Laravel 教程
1323
25
PHP教程
1272
29
C# 教程
1251
24
數字貨幣app是啥軟件?全球數字貨幣十大app盤點 數字貨幣app是啥軟件?全球數字貨幣十大app盤點 Apr 30, 2025 pm 07:06 PM

隨著數字貨幣的普及和發展,越來越多的人開始關注和使用數字貨幣app。這些應用程序為用戶提供了便捷的管理和交易數字資產的方式。那麼,數字貨幣app到底是什麼軟件呢?讓我們深入了解,並盤點全球十大數字貨幣app。

量化交易所排行榜2025 數字貨幣量化交易APP前十名推薦 量化交易所排行榜2025 數字貨幣量化交易APP前十名推薦 Apr 30, 2025 pm 07:24 PM

交易所內置量化工具包括:1. Binance(幣安):提供Binance Futures量化模塊,低手續費,支持AI輔助交易。 2. OKX(歐易):支持多賬戶管理和智能訂單路由,提供機構級風控。獨立量化策略平台有:3. 3Commas:拖拽式策略生成器,適用於多平台對沖套利。 4. Quadency:專業級算法策略庫,支持自定義風險閾值。 5. Pionex:內置16 預設策略,低交易手續費。垂直領域工具包括:6. Cryptohopper:雲端量化平台,支持150 技術指標。 7. Bitsgap:

火幣之前的火信和OKX現在的pay有什麼核心區別? 火幣之前的火信和OKX現在的pay有什麼核心區別? Apr 30, 2025 pm 06:33 PM

火信和OKX Pay都不直接支持法幣支付。火信主要用於數字資產管理和交易,用戶需通過火幣交易所兌換法幣;OKX Pay專注於數字資產支付和轉賬,用戶需通過OKX平台兌換法幣。

數字貨幣app是正規的嗎?全球正規合法虛擬幣交易app前十 數字貨幣app是正規的嗎?全球正規合法虛擬幣交易app前十 Apr 30, 2025 pm 07:09 PM

推薦的加密貨幣交易平台包括:1. Binance:全球最大交易量,支持1400 幣種,FCA、MAS認證。 2. OKX:技術實力強,支持400 幣種,香港證監會批准。 3. Coinbase:美國最大合規平台,適合新手,SEC和FinCEN監管。 4. Kraken:歐洲老牌,ISO 27001認證,持美國MSB及英國FCA牌照。 5. Gate.io:幣種最全(800 ),低交易費,獲多國牌照。 6. Huobi Global:老牌平台,提供多種服務,持日本FSA及香港TCSP牌照。 7. KuCoin

數字貨幣app有前途嗎 蘋果手機數字貨幣交易平台app下載TOP10 數字貨幣app有前途嗎 蘋果手機數字貨幣交易平台app下載TOP10 Apr 30, 2025 pm 07:00 PM

數字貨幣App的前景廣闊,具體體現在:1. 技術創新驅動功能升級,通過DeFi與NFT融合及AI與大數據應用提升用戶體驗;2. 監管合規化趨勢,全球框架完善及AML、KYC要求趨嚴;3. 功能多元化與服務拓展,整合借貸、理財等服務並優化用戶體驗;4. 用戶基數與全球化擴張,預計2025年用戶規模突破10億。

香港數字貨幣交易所app如何下載 十大數字貨幣交易所APP盤點 香港數字貨幣交易所app如何下載 十大數字貨幣交易所APP盤點 Apr 30, 2025 pm 07:12 PM

下載香港數字貨幣交易所APP的方法包括:1. 選擇合規平台,如OSL、HashKey或Binance HK等;2. 通過官方渠道下載,iOS用戶在App Store下載,Android用戶通過Google Play或官網下載;3. 註冊並驗證身份,使用香港手機號或郵箱,上傳身份和地址證明;4. 設置安全措施,啟用雙重身份驗證並定期檢查賬戶活動。

幣圈中的三巨頭是哪些?虛擬幣主流交易所APP前十名推薦 幣圈中的三巨頭是哪些?虛擬幣主流交易所APP前十名推薦 Apr 30, 2025 pm 06:27 PM

在幣圈中,所謂的三巨頭通常指的是三種最具影響力和廣泛使用的加密貨幣。這些加密貨幣在市場上佔據了重要的地位,並在交易量和市值方面都表現出色。同時,虛擬幣主流交易所APP也是投資者和交易者進行加密貨幣交易的重要工具。本文將詳細介紹幣圈中的三巨頭以及推薦前十名的虛擬幣主流交易所APP。

永續倉位的資金費 永續倉位的資金費 Apr 30, 2025 pm 06:42 PM

永續倉位的資金費是持倉者在永續合約交易中需支付或收取的費用,通常每八小時計算一次,影響交易者的盈虧和策略。

See all articles