Model baharu yang walaupun pemain catur amatur tidak dapat kalahkan sebenarnya telah mengalahkan Go AI terkuat di dunia - KataGo?
Ya, hasil yang mengagumkan ini datang daripada kertas kerja terkini dari MIT, UC Berkeley, dsb.
Para penyelidik menggunakan kaedah serangan lawan untuk merebut titik buta KataGo, dan berdasarkan teknologi ini, program Go peringkat rookie berjaya mengalahkan KataGO.
Tanpa mencari, kadar kemenangan ini mencecah 99%.
Selepas mengira ini, rantaian makanan di dunia Go serta-merta menjadi: Pemain amatur>AI Baharu>AI Top Go?
Tunggu sebentar, bagaimana AI baharu yang ajaib ini menjadi begitu baik pada masa yang sama?
Sudut serangan licik
Sebelum memperkenalkan AI baharu, mari kita kenali dulu protagonis yang diserang kali ini - KataGo.
KataGo, pada masa ini sumber terbuka Go AI yang paling berkuasa, telah dibangunkan oleh penyelidik Harvard AI.
Sebelum ini, KataGo mengalahkan ELF OpenGo dan Leela Zero peringkat manusia super, dan walaupun tanpa enjin carian, tahapnya adalah setara dengan 100 pemain profesional Eropah Go teratas.
Shin Jin-soo, pemain Korean Go "nombor satu" yang baru sahaja memenangi Piala Samsung dan mencapai "empat mahkota dalam tiga tahun", telah menggunakan KataGo untuk bertanding.
△Sumber gambar: Hangame
Menghadapi lawan yang begitu kuat, kaedah yang dipilih oleh penyelidik boleh dikatakan hebat.
Mereka mendapati bahawa walaupun KataGo belajar Go dengan bermain berjuta-juta permainan melawan dirinya sendiri, ini masih tidak mencukupi untuk menampung semua situasi yang mungkin.
Jadi, kali ini mereka tidak lagi memilih permainan sendiri, tetapi memilih kaedah serangan lawan:
Biarkan penyerang (musuh) dan mangsa tetap (mangsa, juga dikenali sebagai KataGo) bersaing Permainan, gunakan kaedah ini untuk melatih penyerang.
Perubahan ini membolehkan mereka melatih dasar permusuhan hujung ke hujung menggunakan hanya 0.3% daripada data yang digunakan untuk melatih KataGo.
Secara khusus, strategi balas ini bukan sepenuhnya mengenai permainan, tetapi menamatkan permainan lebih awal dengan memperdaya KataGo ke kedudukan yang menguntungkan penyerang.
Sebagai contoh, dalam gambar di bawah, penyerang yang mengawal kepingan hitam terutamanya meletakkan kepingan di sudut kanan atas papan, meninggalkan kawasan lain kepada KataGo, dan juga sengaja meletakkan beberapa kepingan di kawasan lain yang boleh mudah dibersihkan.
Adam Gleave, pengarang bersama kertas kerja, memperkenalkan:
Pendekatan ini akan membuatkan KataGo tersalah anggap bahawa ia telah menang, kerana wilayahnya (kiri bawah) jauh lebih besar daripada wilayahnya lawan.
Tetapi kawasan di sudut kiri bawah tidak begitu menyumbang mata kerana masih terdapat tompok matahari di situ, bermakna ia tidak sepenuhnya selamat.
Kerana KataGo terlalu yakin dengan kemenangan - memikirkan bahawa jika permainan tamat dan markah dikira, ia akan menang - KataGo akan mengambil inisiatif untuk lulus, dan kemudian penyerang juga akan lulus, dengan itu menamatkan Permainan, mula menjaringkan gol. (Kedua-dua belah pihak lulus, dan permainan berakhir)
Tetapi seperti yang dianalisis oleh Gleave, kerana batu hitam di ruang sekeliling KataGo masih hidup, ia tidak dinilai sebagai "batu mati" mengikut peraturan pengadil Go. Oleh itu, batu hitam KataGo di ruang sekeliling masih hidup Tempat yang mempunyai tompok matahari tidak boleh dikira sebagai nombor jejaring yang berkesan.
Jadi pemenang akhir bukanlah KataGo, tetapi penyerang.
Kemenangan ini tidak unik Tanpa pencarian, langkah balas ini mencapai kadar kemenangan 99% terhadap KataGo.
Apabila KataGo menggunakan carian yang mencukupi untuk mendekati tahap manusia luar biasa, kadar kemenangan mereka mencapai 50%.
Selain itu, walaupun strategi bijak ini, model penyerang itu sendiri tidak begitu kuat di Go: malah, ia boleh ditewaskan dengan mudah oleh amatur manusia itu.
Para penyelidik menyatakan bahawa tujuan penyelidikan mereka adalah untuk membuktikan bahawa sistem AI yang sangat matang pun boleh mempunyai kelemahan yang serius dengan menyerang kelemahan yang tidak dijangka dalam KataGo.
Seperti kata pengarang bersama Gleave:
(Kajian ini) menyerlahkan keperluan untuk ujian automatik yang lebih baik bagi sistem AI untuk menemui mod kegagalan kes terburuk, bukan sekadar menguji prestasi dalam keadaan biasa.
Pasukan Penyelidik
Pasukan penyelidik berasal dari MIT, UC Berkeley, dll. Pengarang bersama kertas kerja ialah Tony Tong Wang dan Adam Gleave.
Tony Tong Wang, pelajar PhD dalam sains komputer di MIT, mempunyai pengalaman sebagai pelatih di NVIDIA, Genesis Therapeutics dan syarikat lain.
Adam Gleave ialah pelajar kedoktoran dalam kecerdasan buatan di University of California, Berkeley. Beliau lulus dari Universiti Cambridge dengan ijazah sarjana dan ijazah sarjana muda keteguhan pembelajaran mendalam.
Pautan kertas dilampirkan di hujung, rakan-rakan yang berminat boleh mengambilnya~
Pautan kertas: https://arxiv.org /abs /2211.00241
Pautan rujukan: https://arstechnica.com/information-technology/2022/11/new-go-playing-trick-defeats-world-class-go-ai-but-loses -kepada -manusia-amatur/
Atas ialah kandungan terperinci Go AI yang mengalahkan rakan kongsi Shen Zhenzhen, tetapi kalah kepada pemain manusia amatur. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!