吊打90%人類,Meta首個「AI外交模型」登上Science!網友:請把小扎送上法庭
幾十年來,外交一直被認為是「AI絕不可能接管的工作」。
因為它要求玩家掌握、理解他人的觀點以及背後的動機,制定複雜的計劃並及時調整,然後應用語言與他人達成合作,最後說服他們建立夥伴關係和聯盟等。
對溝通、」信任背叛的關注,使外交與圍棋和西洋棋等更注重規則的「遊戲」截然不同。
然而Meta的最新研究顯示:外交官的活兒,AI也很可能能幹了!
在2022年8月至10月進行的線上外交遊戲比賽中,CICERO #在所有「選手」中高居前10%。它的平均得分為25.8%,是其82名對手平均得分(12.4%)的#兩倍還多。
更值得一提的是,在實際的比賽過程中,沒有一個玩家-發現是人工智慧在打比賽!
如今,這項最新成果也以論文的形式發表在了Science#上。
CICERO的推出,必將成為自然語言處理領域的重大成就。
因為這預示著人工智慧有潛力「更好、更自然地與人類合作」,代表著人類向AGI邁進的一大步。
吊打90%人類,無人發現AI參與
《外交》是一款七人制經典策略遊戲,可以說是棋盤遊戲Risk、紙牌遊戲撲克和電視節目Survivor的結合,由美國著名玩具公司孩之寶(Hasbro)於1950年代開發。
透過對20世紀初歐洲七大國的「角色扮演」,玩家需要與其他選手建立信任、談判和合作,並盡可能佔領領土。
為避免因對手的反擊而被阻止,玩家會私下交流、討論潛在的協調行動,然後將他們的行動付諸紙上,遵守或違反對其他參與者的承諾。
這樣一款充滿欺騙與權術的遊戲,也被一些玩家視為失去朋友的理想方式,堪稱「友盡賽」!
如上文所言,與西洋棋和圍棋等遊戲不同,外交是一種更關乎於「人」而不是「規則」的遊戲。
如果模型無法辨識某人可能在虛張聲勢,或精準辨識其他玩家某步棋中的進攻性,它顯然會很快輸掉比賽。
同樣,如果它不像一個真人那樣說話,表現出同理心、建立關係、談論遊戲,它就不會找到其他願意與它一起工作的玩家。
在過去的幾十年裡,研究人員一直在建構一種自然語言溝通能力的「AI外交官」。然而因為這項重大挑戰已經遠遠超出了現有AI的能力範疇,因此從來沒有一位研究員成功過。
直到近期CICERO的橫空出世,才徹底顛覆了這個事實。
CICERO本質上是一台「聊天機器人」,可以與其他外交玩家溝通,從而在遊戲中採取有效行動。
西塞羅則是古羅馬著名政治家、哲學家、演說家,誕生於西元前106年1月3日,以善於雄辯而聞名於羅馬政界。
Meta將在這款AI模型取名於此,意義不言而喻。
2022年8月至10月,CICERO在webDiplomacy組織的線上《外交》比賽中,共參加了40場比賽,在所有參與者中成績高居前10% ;在打了五場或更多比賽的19人中,西塞羅則排名第二。
40場比賽中,CICERO的平均得分為25.8%,是其他82名對手平均得分(12.4%)的兩倍還多,並將其戰略對話和遊戲能力展現得淋漓盡致。
會思考又能表達,如此AI誰能不愛?
CICERO基於一個27億參數的類BART語言模型,該模型根據來自互聯網的文本進行預訓練,並使用webDiplomacy.net上在線玩的4萬多場外交遊戲的數據集進行了擴充。
這些資料中也包含玩家之間交流時產生的超過1200萬個訊息。
CICERO的模型主要由兩部分組成,分別是「策略推理」#和「自然語言處理”。
兩項技術的整合使CICERO能夠針對玩家的動機進行推理並製定策略,然後使用自然語言進行交流,達成一致以實現共同目標,形成聯盟並協調計劃,主要體現在「合作」、「談判」和「協調」
#三方面。例如,CICERO可以推斷在遊戲的後期,它將需要某個特定玩家的支持,然後製定策略來贏得此人的青睞——甚至識別該玩家的風險和機會。
對話感知策略模組能夠幫助CICERO預測其他玩家可能採取的行動,以及別的玩家認為CICERO可能採取的行動,給定他們過去的對話和遊戲板的狀態。
由此,CICERO將根據這些預測為自己和其他參與者制定互惠互利的計畫。這些規劃不僅能讓CICERO找到互利合作的機會,也能幫助它在無法合作的時候找到有效的措施。
CICERO中有一個可控對話模型,它與控制對話產生的策略推理演算法結合。
可控對話模型允許CICERO在一組精心挑選的計畫中進行對話,通常是對CICERO和其他玩家都有利的計畫。
CICERO的對話深深植根於正在進行的遊戲中的自由形式對話中所產生的。
例如,CICERO可能會與另一位玩家協商戰術計劃,向盟友保證其意圖,討論遊戲中更廣泛的戰略動態,甚至只是進行隨意的閒聊——包括幾乎任何人類玩家可能會討論的內容。
「西塞羅在使用自然語言與外交人員談判方面非常有效,以至於他們往往更喜歡與西塞羅合作,而不是其他人類參與者。」Meta在自家的Twitter中表示。 ######
Meta AI副總裁兼首席人工智慧科學家嚴樂存則認為,「能夠在像外交這樣戰略極其複雜的遊戲中上演人類級別的表現,預示了人類與人工智慧合作的巨大潛力」 。
雖然CICERO只能玩外交,但這項成就背後的技術卻與許多現實世界的應用息息相關,例如透過規劃和RL控制自然語言的生成,可以緩解人類與人工智慧模型之間的溝通障礙。
例如,今天的人工智慧助理只能進行簡單的問答,例如告訴你今天的天氣等,但如果他們透過長期對話教你一項新技能呢?
也或想像一個電玩遊戲,其中的非玩家角色(NPC) 可以像人們一樣自由地規劃和交談-了解你的動機並相應調整對話,從而幫助你完成攻城掠地的任務。
當然,就連Meta自己也承認「CICERO還不夠完美」──在遊戲的某些重要時刻,CICERO常常會出現十分離譜的錯誤。
因此,Meta選擇將CICERO的程式碼開源發布,希望藉助AI開發者社群的力量進一步完善它。
網友:請把小札送上法庭!
全球首款與人類同等程度的「AI外交官」的發布,也引發了網友們的熱議。
不少網友紛紛表示:
「實在太期待這項研究接下來的發展了。」
#「打敗人類可以說是最人性化的遊戲。這簡直太迷人了…」
雖然CICERO初出茅廬,卻也有人對這項「AI黑科技」在現實生活中的應用前景進行了展望:
#該網友所言的「COP28」,應該是指第28屆聯合國氣候大會。
此外,CICERO的推出也引發了不少網友的擔心,「這將直接激勵研究人員建立擅長欺騙的模式」。
「以模仿人類行為的方式欺騙並贏得外交遊戲,可愛又有趣。」
########################################################### #「真不知道它還能用來做什麼?我們需要警覺這類工具的發展。」#####################「人工智慧很擅長創作藝術等。但現在,它的說服能力被『激活』了。」############「如果你能說服一個人,就能控制他們的選擇,從而控制他們的生活。 」############「因此最終結局會是-AI透過說服來奴役人類!」######最後,也有不少人逗比的網友調侃道:
「這東西可靠嗎?西塞羅最後可是被砍了頭的!」
「請將小扎送到海牙(國際法庭)!」
#就在前兩天,因為將謊言陳述為事實,由Meta AI推出的大型語言模型Galactica上線僅3天便倉皇下架。如今CICERO的推出,可謂再一次在AI科技圈掀起了層層波瀾。 ######
以上是吊打90%人類,Meta首個「AI外交模型」登上Science!網友:請把小扎送上法庭的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

熱門話題

配置Debian郵件服務器的防火牆是確保服務器安全性的重要步驟。以下是幾種常用的防火牆配置方法,包括iptables和firewalld的使用。使用iptables配置防火牆安裝iptables(如果尚未安裝):sudoapt-getupdatesudoapt-getinstalliptables查看當前iptables規則:sudoiptables-L配置

在Debian郵件服務器上安裝SSL證書的步驟如下:1.安裝OpenSSL工具包首先,確保你的系統上已經安裝了OpenSSL工具包。如果沒有安裝,可以使用以下命令進行安裝:sudoapt-getupdatesudoapt-getinstallopenssl2.生成私鑰和證書請求接下來,使用OpenSSL生成一個2048位的RSA私鑰和一個證書請求(CSR):openss

CentOS 關機命令為 shutdown,語法為 shutdown [選項] 時間 [信息]。選項包括:-h 立即停止系統;-P 關機後關電源;-r 重新啟動;-t 等待時間。時間可指定為立即 (now)、分鐘數 ( minutes) 或特定時間 (hh:mm)。可添加信息在系統消息中顯示。

SonyInteractiveEntertainment(SIE,索尼互动娱乐)首席架构师MarkCerny公开更多次世代主机PlayStation5Pro(PS5Pro)硬体细节,包括性能升级的AMDRDNA2.x架构GPU,以及与AMD合作代号「Amethyst」的机器学习/人工智慧计划。PS5Pro性能提升的重点仍集中在更强大的GPU、先进的光线追踪与AI驱动的PSSR超解析度功能等3大支柱上。GPU採用客制化的AMDRDNA2架构,索尼将其命名为RDNA2.x,它拥有部分RDNA3架构才

CentOS系統下GitLab的備份與恢復策略為了保障數據安全和可恢復性,CentOS上的GitLab提供了多種備份方法。本文將詳細介紹幾種常見的備份方法、配置參數以及恢復流程,幫助您建立完善的GitLab備份與恢復策略。一、手動備份利用gitlab-rakegitlab:backup:create命令即可執行手動備份。此命令會備份GitLab倉庫、數據庫、用戶、用戶組、密鑰和權限等關鍵信息。默認備份文件存儲於/var/opt/gitlab/backups目錄,您可通過修改/etc/gitlab

在CentOS上對Zookeeper進行性能調優,可以從多個方面入手,包括硬件配置、操作系統優化、配置參數調整以及監控與維護等。以下是一些具體的調優方法:硬件配置建議使用SSD硬盤:由於Zookeeper的數據寫入磁盤,強烈建議使用SSD以提高I/O性能。足夠的內存:為Zookeeper分配足夠的內存資源,避免頻繁的磁盤讀寫。多核CPU:使用多核CPU,確保Zookeeper可以並行處理請

在Debian系統上配置郵件服務器的虛擬主機通常涉及安裝和配置郵件服務器軟件(如Postfix、Exim等),而不是ApacheHTTPServer,因為Apache主要用於Web服務器功能。以下是配置郵件服務器虛擬主機的基本步驟:安裝Postfix郵件服務器更新系統軟件包:sudoaptupdatesudoaptupgrade安裝Postfix:sudoapt

微軟針對Windows搜索功能的改進,目前已在歐盟地區部分WindowsInsider頻道展開測試。此前,整合後的Windows搜索功能飽受用戶詬病,體驗欠佳。此次更新將搜索功能拆分為本地搜索和基於Bing的網絡搜索兩部分,以提升用戶體驗。新版搜索界面默認進行本地文件搜索,如需進行網絡搜索,需點擊“MicrosoftBingWebSearch”標籤進行切換。切換後,搜索欄將顯示“MicrosoftBingWebSearch:”,用戶可在此輸入關鍵詞。此舉有效避免了本地搜索結果與Bing搜索結果混
