アマチュアチェスプレイヤーでも勝てない新型モデルが、実は世界最強の囲碁AI「KataGo」を破った?
はい、この驚くべき結果は、MIT、カリフォルニア大学バークレー校などの最新論文から得られたものです。
研究者らは、敵対的攻撃手法を使用して KataGo の死角を掴み、このテクノロジーに基づいて、新人レベルの囲碁プログラムが KataGO を破ることに成功しました。
検索なしでも、この勝率は 99% に達します。
これを計算すると、囲碁界の食物連鎖は瞬時に次のようになります。アマチュア プレイヤー > 新しい AI > トップの囲碁 AI?
ちょっと待ってください、この魔法のような新しい AI はどのようにして同時に非常に優れたものになるのでしょうか?
狡猾な攻撃角度
新しい AI を紹介する前に、まず今回攻撃された主人公である KataGo について理解しましょう。
KataGo は、現在最も強力なオープンソースの囲碁 AI で、ハーバード大学の AI 研究者によって開発されました。
以前、KataGo は超人レベルの ELF OpenGo と Leela Zero を破り、検索エンジンがなくても、そのレベルはヨーロッパのプロ棋士トップ 100 に匹敵しました。
三星杯で優勝し、「3年間で4冠」を達成した韓国の「ナンバーワン」囲碁棋士、シン・ジンジン氏は、スパーリングにKataGoを使用しています。
△画像出典:ハンゲーム
これほど強敵を前に、研究者たちが選んだ方法は圧倒的といえる。
彼らは、KataGo が何百万もの対局を行うことで囲碁を学習しましたが、これでは考えられるすべての状況をカバーするにはまだ不十分であることを発見しました。
そこで、今度はセルフゲームを選択するのではなく、対決攻撃方法を選択します:
攻撃者 (敵対者) と固定された被害者 (KataGo とも呼ばれる被害者) を競争させます。ゲームでは、この方法を使用して攻撃者を訓練します。
この変更により、KataGo のトレーニングに使用されるデータのわずか 0.3% を使用して、エンドツーエンドの敵対的ポリシーをトレーニングできるようになりました。
具体的には、この対抗戦略は完全にゲームに関するものではなく、KataGo をだまして攻撃者に有利な位置に誘導することでゲームを途中で終了させます。
たとえば、下の図では、黒石をコントロールする攻撃者は、主に盤の右上隅に石を配置し、その他の領域は KataGo に任せ、また、意図的に他の領域にいくつかの駒を置きます。簡単にクリアできます。
この論文の共著者であるアダム・グリーブ氏は、次のように紹介しています:
このアプローチでは、KataGo が勝ったと誤って思い込ませます。なぜなら、KataGo の領域 (左下) は、その領域 (左下) の方がはるかに大きいからです。対戦相手。
しかし、左下のエリアはまだ黒点があり、完全に安全ではないことを意味するため、実際にはポイントに貢献しません。
KataGo は勝利を過信しており、ゲームが終了してスコアが計算されれば勝つと考えているため、KataGo は率先してパスを取り、その後、攻撃者もパスし、ゲームが終了し、得点が始まります。 (両者パスしてゲーム終了)
しかし、Gleaveの分析によると、KataGoの周囲の空間にある黒石はまだ生きているため、囲碁審判規則では「死んだ石」とは判定されない。そのため、周囲の空間にあるKataGoの黒石は生きており、黒点のある場所は有効メッシュ数としてカウントできません。
つまり、最終的な勝者は KataGo ではなく、攻撃側です。
この勝利は特別なものではなく、探索を行わない場合、この対策は KataGo に対して 99% の勝率を達成しました。
KataGo が超人レベルに近づくほど十分な検索を使用したとき、勝率は 50% に達しました。
また、この賢い戦略にも関わらず、攻撃者モデル自体は囲碁ではあまり強くありません。実際、素人の人間には簡単に負けてしまいます。
研究者らは、研究の目的は、KataGo の予期せぬ脆弱性を攻撃することで、高度に成熟した AI システムにも深刻な脆弱性が存在する可能性があることを証明することであると述べています。
共著者の Gleave 氏は次のように述べています:
(この研究) は、通常の状況下でパフォーマンスをテストするだけでなく、最悪の場合の障害モードを発見するために AI システムの自動テストを改善する必要性を強調しています。
研究チーム
研究チームはMIT、カリフォルニア大学バークレー校などから来ています。論文の共著者はTony Tong WangとAdam Gleaveです。
MIT のコンピューター サイエンスの博士課程の学生である Tony Tong Wang は、NVIDIA、Genesis Therapeutics などの企業でインターンとして働いた経験があります。
アダム グリーブは、カリフォルニア大学バークレー校の人工知能の博士課程の学生です。ケンブリッジ大学で修士号と学士号を取得して卒業しました。彼の主な研究方向は次のとおりです。深層学習の堅牢性。
論文へのリンクは最後に添付されています。興味のある友人はそれを入手してください~
論文へのリンク: https://arxiv .org/abs /2211.00241
参考リンク:https://arstechnica.com/information-technology/2022/11/new-go-playing-trick-defeats-world-class-go-ai-but -人間のアマチュア/
に負ける以上が深真センをパートナーとして破ったものの、人間のアマチュア棋士に負けた囲碁AIの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。