目錄
吊打90%人類,無人發現AI參與
會思考又能表達,如此AI誰能不愛?
網友:請把小札送上法庭!
首頁 科技週邊 人工智慧 吊打90%人類,Meta首個「AI外交模型」登上Science!網友:請把小扎送上法庭

吊打90%人類,Meta首個「AI外交模型」登上Science!網友:請把小扎送上法庭

Apr 14, 2023 pm 05:13 PM
ai 外交

幾十年來,外交一直被認為是「AI絕不可能接管的工作」。

因為它要求玩家掌握、理解他人的觀點以及背後的動機,制定複雜的計劃並及時調整,然後應用語言與他人達成合作,最後說服他們建立夥伴關係和聯盟等。

溝通」信任背叛的關注,使外交與圍棋和西洋棋等更注重規則的「遊戲」截然不同。

然而Meta的最新研究顯示:外交官的活兒,AI也很可能能幹了!

在2022年8月至10月進行的線上外交遊戲比賽中,CICERO #在所有「選手」中高居前10%。它的平均得分為25.8%,是其82名對手平均得分(12.4%)的#兩倍還多

更值得一提的是,在實際的比賽過程中,沒有一個玩家-發現是人工智慧在打比賽!

如今,這項最新成果也以論文的形式發表在了Science#上。

吊打90%人類,Meta首個「AI外交模型」登上Science!網友:請把小扎送上法庭

CICERO的推出,必將成為自然語言處理領域的重大成就。

因為這預示著人工智慧有潛力「更好、更自然地與人類合作」,代表著人類向AGI邁進的一大步。

吊打90%人類,無人發現AI參與

《外交》是一款七人制經典策略遊戲,可以說是棋盤遊戲Risk、紙牌遊戲撲克和電視節目Survivor的結合,由美國著名玩具公司孩之寶(Hasbro)於1950年代開發。

透過對20世紀初歐洲七大國的「角色扮演」,玩家需要與其他選手建立信任、談判和合作,並盡可能佔領領土。

為避免因對手的反擊而被阻止,玩家會私下交流、討論潛在的協調行動,然後將他們的行動付諸紙上,遵守或違反對其他參與者的承諾。

這樣一款充滿欺騙與權術的遊戲,也被一些玩家視為失去朋友的理想方式,堪稱「友盡賽」!

如上文所言,與西洋棋和圍棋等遊戲不同,外交是一種更關乎於「人」而不是「規則」的遊戲。

如果模型無法辨識某人可能在虛張聲勢,或精準辨識其他玩家某步棋中的進攻性,它顯然會很快輸掉比賽。

同樣,如果它不像一個真人那樣說話,表現出同理心、建立關係、談論遊戲,它就不會找到其他願意與它一起工作的玩家。

在過去的幾十年裡,研究人員一直在建構一種自然語言溝通能力的「AI外交官」。然而因為這項重大挑戰已經遠遠超出了現有AI的能力範疇,因此從來沒有一位研究員成功過。

直到近期CICERO的橫空出世,才徹底顛覆了這個事實。

吊打90%人類,Meta首個「AI外交模型」登上Science!網友:請把小扎送上法庭

CICERO本質上是一台「聊天機器人」,可以與其他外交玩家溝通,從而在遊戲中採取有效行動。

西塞羅則是古羅馬著名政治家、哲學家、演說家,誕生於西元前106年1月3日,以善於雄辯而聞名於羅馬政界。

Meta將在這款AI模型取名於此,意義不言而喻。

2022年8月至10月,CICERO在webDiplomacy組織的線上《外交》比賽中,共參加了40場比賽,在所有參與者中成績高居前10% ;在打了五場或更多比賽的19人中,西塞羅則排名第二。

40場比賽中,CICERO的平均得分為25.8%,是其他82名對手平均得分(12.4%)的兩倍還多,並將其戰略對話和遊戲能力展現得淋漓盡致。

會思考又能表達,如此AI誰能不愛?

CICERO基於一個27億參數的類BART語言模型,該模型根據來自互聯網的文本進行預訓練,並使用webDiplomacy.net上在線玩的4萬多場外交遊戲的數據集進行了擴充。

這些資料中也包含玩家之間交流時產生的超過1200萬個訊息。

CICERO的模型主要由兩部分組成,分別是「策略推理」#和「自然語言處理”

兩項技術的整合使CICERO能夠針對玩家的動機進行推理並製定策略,然後使用自然語言進行交流,達成一致以實現共同目標,形成聯盟並協調計劃,主要體現在「合作」「談判」「協調」

#三方面。

例如,CICERO可以推斷在遊戲的後期,它將需要某個特定玩家的支持,然後製定策略來贏得此人的青睞——甚至識別該玩家的風險和機會。

對話感知策略模組能夠幫助CICERO預測其他玩家可能採取的行動,以及別的玩家認為CICERO可能採取的行動,給定他們過去的對話和遊戲板的狀態。

由此,CICERO將根據這些預測為自己和其他參與者制定互惠互利的計畫。這些規劃不僅能讓CICERO找到互利合作的機會,也能幫助它在無法合作的時候找到有效的措施。

CICERO中有一個可控對話模型,它與控制對話產生的策略推理演算法結合。

吊打90%人類,Meta首個「AI外交模型」登上Science!網友:請把小扎送上法庭

可控對話模型允許CICERO在一組精心挑選的計畫中進行對話,通常是對CICERO和其他玩家都有利的計畫。

CICERO的對話深深植根於正在進行的遊戲中的自由形式對話中所產生的。

例如,CICERO可能會與另一位玩家協商戰術計劃,向盟友保證其意圖,討論遊戲中更廣泛的戰略動態,甚至只是進行隨意的閒聊——包括幾乎任何人類玩家可能會討論的內容。

吊打90%人類,Meta首個「AI外交模型」登上Science!網友:請把小扎送上法庭

「西塞羅在使用自然語言與外交人員談判方面非常有效,以至於他們往往更喜歡與西塞羅合作,而不是其他人類參與者。」Meta在自家的Twitter中表示。 ######

Meta AI副總裁兼首席人工智慧科學家嚴樂存則認為,「能夠在像外交這樣戰略極其複雜的遊戲中上演人類級別的表現,預示了人類與人工智慧合作的巨大潛力」 。

雖然CICERO只能玩外交,但這項成就背後的技術卻與許多現實世界的應用息息相關,例如透過規劃和RL控制自然語言的生成,可以緩解人類與人工智慧模型之間的溝通障礙。

例如,今天的人工智慧助理只能進行簡單的問答,例如告訴你今天的天氣等,但如果他們透過長期對話教你一項新技能呢?

也或想像一個電玩遊戲,其中的非玩家角色(NPC) 可以像人們一樣自由地規劃和交談-了解你的動機並相應調整對話,從而幫助你完成攻城掠地的任務。

當然,就連Meta自己也承認「CICERO還不夠完美」──在遊戲的某些重要時刻,CICERO常常會出現十分離譜的錯誤。

因此,Meta選擇將CICERO的程式碼開源發布,希望藉助AI開發者社群的力量進一步完善它。

網友:請把小札送上法庭!

全球首款與人類同等程度的「AI外交官」的發布,也引發了網友們的熱議。

不少網友紛紛表示:

「實在太期待這項研究接下來的發展了。」

#「打敗人類可以說是最人性化的遊戲。這簡直太迷人了…」

吊打90%人類,Meta首個「AI外交模型」登上Science!網友:請把小扎送上法庭

吊打90%人類,Meta首個「AI外交模型」登上Science!網友:請把小扎送上法庭

吊打90%人類,Meta首個「AI外交模型」登上Science!網友:請把小扎送上法庭

雖然CICERO初出茅廬,卻也有人對這項「AI黑科技」在現實生活中的應用前景進行了展望:

吊打90%人類,Meta首個「AI外交模型」登上Science!網友:請把小扎送上法庭

「它能建構一個版本來幫助應對集體行動挑戰嗎,例如#COP28?」

#該網友所言的「COP28」,應該是指第28屆聯合國氣候大會。

吊打90%人類,Meta首個「AI外交模型」登上Science!網友:請把小扎送上法庭

在剛結束的27屆氣候大會上,經過持續數天的緊張談判,各國代表最終同意設立一個基金機制,以補償因氣候變遷引發的損失和損害。

此外,CICERO的推出也引發了不少網友的擔心,「這將直接激勵研究人員建立擅長欺騙的模式」。

「以模仿人類行為的方式欺騙並贏得外交遊戲,可愛又有趣。」

########################################################### #「真不知道它還能用來做什麼?我們需要警覺這類工具的發展。」#####################「人工智慧很擅長創作藝術等。但現在,它的說服能力被『激活』了。」############「如果你能說服一個人,就能控制他們的選擇,從而控制他們的生活。 」############「因此最終結局會是-AI透過說服來奴役人類!」######

吊打90%人類,Meta首個「AI外交模型」登上Science!網友:請把小扎送上法庭

最後,也有不少人逗比的網友調侃道:

「這東西可靠嗎?西塞羅最後可是被砍了頭的!」

「請將小扎送到海牙(國際法庭)!」

吊打90%人類,Meta首個「AI外交模型」登上Science!網友:請把小扎送上法庭

#就在前兩天,因為將謊言陳述為事實,由Meta AI推出的大型語言模型Galactica上線僅3天便倉皇下架。如今CICERO的推出,可謂再一次在AI科技圈掀起了層層波瀾。 ######

以上是吊打90%人類,Meta首個「AI外交模型」登上Science!網友:請把小扎送上法庭的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

<🎜>:泡泡膠模擬器無窮大 - 如何獲取和使用皇家鑰匙
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
北端:融合系統,解釋
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
Mandragora:巫婆樹的耳語 - 如何解鎖抓鉤
3 週前 By 尊渡假赌尊渡假赌尊渡假赌

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Java教學
1666
14
CakePHP 教程
1425
52
Laravel 教程
1323
25
PHP教程
1272
29
C# 教程
1251
24
C  中的chrono庫如何使用? C 中的chrono庫如何使用? Apr 28, 2025 pm 10:18 PM

使用C 中的chrono庫可以讓你更加精確地控制時間和時間間隔,讓我們來探討一下這個庫的魅力所在吧。 C 的chrono庫是標準庫的一部分,它提供了一種現代化的方式來處理時間和時間間隔。對於那些曾經飽受time.h和ctime折磨的程序員來說,chrono無疑是一個福音。它不僅提高了代碼的可讀性和可維護性,還提供了更高的精度和靈活性。讓我們從基礎開始,chrono庫主要包括以下幾個關鍵組件:std::chrono::system_clock:表示系統時鐘,用於獲取當前時間。 std::chron

如何理解C  中的DMA操作? 如何理解C 中的DMA操作? Apr 28, 2025 pm 10:09 PM

DMA在C 中是指DirectMemoryAccess,直接內存訪問技術,允許硬件設備直接與內存進行數據傳輸,不需要CPU干預。 1)DMA操作高度依賴於硬件設備和驅動程序,實現方式因係統而異。 2)直接訪問內存可能帶來安全風險,需確保代碼的正確性和安全性。 3)DMA可提高性能,但使用不當可能導致系統性能下降。通過實踐和學習,可以掌握DMA的使用技巧,在高速數據傳輸和實時信號處理等場景中發揮其最大效能。

怎樣在C  中處理高DPI顯示? 怎樣在C 中處理高DPI顯示? Apr 28, 2025 pm 09:57 PM

在C 中處理高DPI顯示可以通過以下步驟實現:1)理解DPI和縮放,使用操作系統API獲取DPI信息並調整圖形輸出;2)處理跨平台兼容性,使用如SDL或Qt的跨平台圖形庫;3)進行性能優化,通過緩存、硬件加速和動態調整細節級別來提升性能;4)解決常見問題,如模糊文本和界面元素過小,通過正確應用DPI縮放來解決。

C  中的實時操作系統編程是什麼? C 中的實時操作系統編程是什麼? Apr 28, 2025 pm 10:15 PM

C 在實時操作系統(RTOS)編程中表現出色,提供了高效的執行效率和精確的時間管理。 1)C 通過直接操作硬件資源和高效的內存管理滿足RTOS的需求。 2)利用面向對象特性,C 可以設計靈活的任務調度系統。 3)C 支持高效的中斷處理,但需避免動態內存分配和異常處理以保證實時性。 4)模板編程和內聯函數有助於性能優化。 5)實際應用中,C 可用於實現高效的日誌系統。

怎樣在C  中測量線程性能? 怎樣在C 中測量線程性能? Apr 28, 2025 pm 10:21 PM

在C 中測量線程性能可以使用標準庫中的計時工具、性能分析工具和自定義計時器。 1.使用庫測量執行時間。 2.使用gprof進行性能分析,步驟包括編譯時添加-pg選項、運行程序生成gmon.out文件、生成性能報告。 3.使用Valgrind的Callgrind模塊進行更詳細的分析,步驟包括運行程序生成callgrind.out文件、使用kcachegrind查看結果。 4.自定義計時器可靈活測量特定代碼段的執行時間。這些方法幫助全面了解線程性能,並優化代碼。

給MySQL表添加和刪除字段的操作步驟 給MySQL表添加和刪除字段的操作步驟 Apr 29, 2025 pm 04:15 PM

在MySQL中,添加字段使用ALTERTABLEtable_nameADDCOLUMNnew_columnVARCHAR(255)AFTERexisting_column,刪除字段使用ALTERTABLEtable_nameDROPCOLUMNcolumn_to_drop。添加字段時,需指定位置以優化查詢性能和數據結構;刪除字段前需確認操作不可逆;使用在線DDL、備份數據、測試環境和低負載時間段修改表結構是性能優化和最佳實踐。

量化交易所排行榜2025 數字貨幣量化交易APP前十名推薦 量化交易所排行榜2025 數字貨幣量化交易APP前十名推薦 Apr 30, 2025 pm 07:24 PM

交易所內置量化工具包括:1. Binance(幣安):提供Binance Futures量化模塊,低手續費,支持AI輔助交易。 2. OKX(歐易):支持多賬戶管理和智能訂單路由,提供機構級風控。獨立量化策略平台有:3. 3Commas:拖拽式策略生成器,適用於多平台對沖套利。 4. Quadency:專業級算法策略庫,支持自定義風險閾值。 5. Pionex:內置16 預設策略,低交易手續費。垂直領域工具包括:6. Cryptohopper:雲端量化平台,支持150 技術指標。 7. Bitsgap:

C  中的字符串流如何使用? C 中的字符串流如何使用? Apr 28, 2025 pm 09:12 PM

C 中使用字符串流的主要步驟和注意事項如下:1.創建輸出字符串流並轉換數據,如將整數轉換為字符串。 2.應用於復雜數據結構的序列化,如將vector轉換為字符串。 3.注意性能問題,避免在處理大量數據時頻繁使用字符串流,可考慮使用std::string的append方法。 4.注意內存管理,避免頻繁創建和銷毀字符串流對象,可以重用或使用std::stringstream。

See all articles