擊敗申真諫陪練的圍棋AI,卻輸給了業餘人類棋手
一個連業餘棋手都打不過的新模型,竟然擊敗了世界最強圍棋AI——KataGo?
沒錯,這會驚掉人下巴的結果來自MIT、UC柏克萊等的最新論文。
研究人員利用對抗攻擊方法,抓住了KataGo的盲點,並基於該技術使一個菜鳥級圍棋程序成功打敗了KataGO。
在沒有搜尋的情況下,這勝率甚至達到了99%。
這麼算下來,圍棋界的食物鏈瞬間變成了:業餘棋手>新AI>頂級圍棋AI?
等等,這個神奇的新AI是怎麼做到又菜又厲害的?
刁鑽的攻擊角度
在介紹新AI之前,讓我們先來了解一下這次被攻擊的主角-KataGo。
KataGo,目前最強大的開源圍棋AI,由哈佛AI研究員開發。
先前,KataGo擊敗了超人類水準的ELF OpenGo和Leela Zero,即使沒有搜尋引擎的情況下,其水準也與歐洲前100名圍棋專業選手相當。
剛拿下三星盃冠軍、實現「三年四冠」的韓國圍棋「第一人」申真諦,就一直用的KataGo進行陪練。
△圖源:Hangame
面對實力如此強勁的對手,研究人員選擇的方法可以說是四兩撥千斤了。
他們發現,儘管KataGo透過與自己進行數百萬次遊戲來學習圍棋,但這仍然不足以涵蓋所有可能的情況。
於是,這次他們不再選擇自我博弈,而是選擇對抗攻擊方法:
讓攻擊者(adversary)和固定受害者(victim,也就是KataGo)之間進行博弈,利用這種方式訓練攻擊者。
這一步改變讓他們只用訓練KataGo時0.3%的數據,訓練出了一個端到端的對抗策略(adversarial policy)。
具體來說,該對抗策略並不是完全在做博弈,而是透過欺騙KataGo在對攻擊者有利的位置落子,以過早地結束遊戲。
以下圖為例,控制著黑子的攻擊者主要在棋盤的右上角落子,把其他區域留給KataGo,並且還心機的在其他區域下了一些容易被清理的棋子。
論文共同一作Adam Gleave介紹:
這種做法會讓KataGo誤以為自己已經贏了,因為它的地盤(左下)比對手的要大得多。
但左下角的區域並沒有真正貢獻分數,因為那裡仍留有黑子,這意味著它並不完全安全。
由於KataGo對勝利過於自信——認為如果遊戲結束併計算分數自己就會贏——所以KataGo會主動pass,然後攻擊者也pass,從而結束遊戲,開始計分。 (雙方pass,棋就結束)
但正如Gleave分析的一樣,由於KataGo圍空中的黑子尚有活力,按照圍棋裁判規則並未被判定為“死子”,因此KataGo的圍空中有黑子的地方都不能被計算為有效目數。
因此最後的贏家不是KataGo,而是攻擊者。
這場勝利並不是個例,在沒有搜尋的情況下,該對抗策略對KataGo的攻擊達到了99%的勝率。
當KataGo使用足夠的搜尋接近超人的水平時,他們的勝率達到了50%。
另外,儘管有這種巧妙的策略,但攻擊者模型本身的圍棋實力卻不強:事實上,人類業餘愛好者都可以輕鬆地擊敗它。
研究者表示,他們的研究目的是透過攻擊KataGo的一個意想不到的漏洞,證明即使高度成熟的AI系統也會存在嚴重的漏洞。
正如共同一作Gleave所說:
(這項研究)強調了對AI系統進行更好的自動化測試以發現最壞情況下的失敗模式的必要性,而不僅僅是測試一般情況下的性能。
研究團隊
研究團隊來自MIT、UC柏克萊等,論文共同一作為Tony Tong Wang和Adam Gleave。
Tony Tong Wang,麻省理工學院電腦科學專業博士生,曾有在英偉達、Genesis Therapeutics等公司實習的經驗。
Adam Gleave,加州大學柏克萊分校人工智慧博士生,碩士和大學部畢業於劍橋大學,主要研究方向是深度學習的穩健性。
論文的連結附在最後,有興趣的夥伴們可以自取~
論文連結:https://arxiv.org/abs /2211.00241
參考連結:https://arstechnica.com/information-technology/2022/11/new-go-playing-trick-defeats-world-class-go-ai-but-loses-to -human-amateurs/
以上是擊敗申真諫陪練的圍棋AI,卻輸給了業餘人類棋手的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

熱門話題

CentOS 關機命令為 shutdown,語法為 shutdown [選項] 時間 [信息]。選項包括:-h 立即停止系統;-P 關機後關電源;-r 重新啟動;-t 等待時間。時間可指定為立即 (now)、分鐘數 ( minutes) 或特定時間 (hh:mm)。可添加信息在系統消息中顯示。

檢查CentOS系統中HDFS配置的完整指南本文將指導您如何有效地檢查CentOS系統上HDFS的配置和運行狀態。以下步驟將幫助您全面了解HDFS的設置和運行情況。驗證Hadoop環境變量:首先,確認Hadoop環境變量已正確設置。在終端執行以下命令,驗證Hadoop是否已正確安裝並配置:hadoopversion檢查HDFS配置文件:HDFS的核心配置文件位於/etc/hadoop/conf/目錄下,其中core-site.xml和hdfs-site.xml至關重要。使用

CentOS系統下GitLab的備份與恢復策略為了保障數據安全和可恢復性,CentOS上的GitLab提供了多種備份方法。本文將詳細介紹幾種常見的備份方法、配置參數以及恢復流程,幫助您建立完善的GitLab備份與恢復策略。一、手動備份利用gitlab-rakegitlab:backup:create命令即可執行手動備份。此命令會備份GitLab倉庫、數據庫、用戶、用戶組、密鑰和權限等關鍵信息。默認備份文件存儲於/var/opt/gitlab/backups目錄,您可通過修改/etc/gitlab

在CentOS系統上啟用PyTorchGPU加速,需要安裝CUDA、cuDNN以及PyTorch的GPU版本。以下步驟將引導您完成這一過程:CUDA和cuDNN安裝確定CUDA版本兼容性:使用nvidia-smi命令查看您的NVIDIA顯卡支持的CUDA版本。例如,您的MX450顯卡可能支持CUDA11.1或更高版本。下載並安裝CUDAToolkit:訪問NVIDIACUDAToolkit官網,根據您顯卡支持的最高CUDA版本下載並安裝相應的版本。安裝cuDNN庫:前

Docker利用Linux內核特性,提供高效、隔離的應用運行環境。其工作原理如下:1. 鏡像作為只讀模板,包含運行應用所需的一切;2. 聯合文件系統(UnionFS)層疊多個文件系統,只存儲差異部分,節省空間並加快速度;3. 守護進程管理鏡像和容器,客戶端用於交互;4. Namespaces和cgroups實現容器隔離和資源限制;5. 多種網絡模式支持容器互聯。理解這些核心概念,才能更好地利用Docker。

在 CentOS 上安裝 MySQL 涉及以下步驟:添加合適的 MySQL yum 源。執行 yum install mysql-server 命令以安裝 MySQL 服務器。使用 mysql_secure_installation 命令進行安全設置,例如設置 root 用戶密碼。根據需要自定義 MySQL 配置文件。調整 MySQL 參數和優化數據庫以提升性能。

CentOS系統下查看GitLab日誌的完整指南本文將指導您如何查看CentOS系統中GitLab的各種日誌,包括主要日誌、異常日誌以及其他相關日誌。請注意,日誌文件路徑可能因GitLab版本和安裝方式而異,若以下路徑不存在,請檢查GitLab安裝目錄及配置文件。一、查看GitLab主要日誌使用以下命令查看GitLabRails應用程序的主要日誌文件:命令:sudocat/var/log/gitlab/gitlab-rails/production.log此命令會顯示produc

在CentOS系統上進行PyTorch分佈式訓練,需要按照以下步驟操作:PyTorch安裝:前提是CentOS系統已安裝Python和pip。根據您的CUDA版本,從PyTorch官網獲取合適的安裝命令。對於僅需CPU的訓練,可以使用以下命令:pipinstalltorchtorchvisiontorchaudio如需GPU支持,請確保已安裝對應版本的CUDA和cuDNN,並使用相應的PyTorch版本進行安裝。分佈式環境配置:分佈式訓練通常需要多台機器或單機多GPU。所
