2016 年は人工知能の台頭の年です。
AlphaGoが囲碁世界チャンピオンのイ・セドルを破って以来、囲碁のトップレベルを代表する棋士たちはもはや人間ではなくなった。
しかし、今日のフィナンシャル・タイムズ紙の記事により、囲碁が人々の視野に戻りました。人類は AI を倒す方法を見つけました。
7年間の休眠を経て、人間のチェスプレイヤーは復活するのでしょうか?
FTは、米国のアマチュアチェス四段、ケリン・ペリン氏がチェスのトッププレイヤーであるAI-KataGoを一気に破ったと報じた。
オフライン マッチ 15 件のうち、パーラインは 14 件でコンピューターの助けを借りずに勝利しました。
人間のプレイヤーが囲碁の王座を取り戻せるようにする計画は、カリフォルニアの調査会社 FAR AI の研究者らによってもたらされました。チームはAIチェスプレイヤーの弱点を分析し、最終的な勝利を達成するためにそれらをターゲットにしました。
FAR AI CEO のアダム グリーブ氏は、「このシステムを悪用するのは非常に簡単です。」と述べました。 KataGo で 100 万回以上の対局を行った結果、チームが開発した AI は人間のプレイヤーが悪用できる「バグ」を発見しました。
ペリーヌ氏は、自分たちが発見した必勝法は「人間にとってはそれほど難しくない」もので、中級者でもそれを使えばマシンを倒すことができると述べた。彼はまた、この方法を使用して、別のトップ囲碁システムである Leela Zero を破りました。
#Kellin Pelrine
FT が書きました、コンピューターの助けがあったとはいえ、この決定的な勝利は人間のチェスプレイヤーへの扉を開きました。
7 年前、人工知能は最も複雑なゲームにおいて人間をはるかに上回っていました。
DeepMind が設計した AlphaGo システムは、2016 年に囲碁世界チャンピオンのイ・セドルを 4 対 1 で破りました。イ・セドル氏も惨敗から3年後に引退を表明し、AlphaGoを「無敵」と呼んだ。
人工知能の強さについて、ペリーヌはそれを真剣に考えていません。彼の意見では、チェスのゲームには多数の組み合わせとバリエーションがあるということは、コンピューターがチェスプレイヤーの将来の可能性のあるすべての手を評価するのは不可能であることを意味します。
ペルリーヌの戦略を簡単に言うと、「東を攻めて西を攻める」というものです。
一方で、ペリーヌは AI を混乱させるためにチェス盤の隅々に石を配置しますが、他方では、ペリーヌは AI プレイヤーの領域を特定します。エリアを徐々に囲んでいきます。
ペリーヌは、包囲が完了しようとしていたにもかかわらず、AIチェスプレイヤーはそのことに気付かなかったと言いました。この地域には危険があります。 「しかし、人間として、こうした脆弱性は簡単に見つけられます。」
カリフォルニア大学バークレー校のコンピューターサイエンス教授であるスチュアート・ラッセル氏は、最も先進的なコンピューターのいくつかは、囲碁ゲーム機の弱点が発見され、今日の最先端のAIを支える深層学習システムに根本的な欠陥があることが示唆された。
これらのシステムは経験した特定の状況を「理解」することしかできず、人間のように戦略について単純に一般化することはできないと同氏は述べた。
AIを倒せるのはAIだけ!しかし、厳密に言えば、研究者らは AI を通じて AI を破った、言い換えれば、人間が囲碁で AI に勝つのを助けるために AI を使用したのです。
参照元として使用された論文は、2022 年 11 月に初版が発行され、今年 1 月に更新されました。著者は MIT、カリフォルニア大学バークレー校などの機関です。
記事では、研究者らは耐性戦略を備えた AI を訓練し、最先端の囲碁人工知能システムである KataGo を破りました。
プロジェクトアドレス: https://go Attack.far.ai/adversarial-policy-katago#contents
論文アドレス: https://arxiv.org/abs/2211.00241
結果は次のようになります。 KataGo が検索ツリーを使用しない場合、攻撃者は 1,000 試合で 100% の勝率を達成します。KataGo が十分な検索を使用した場合、勝率は 97% を超えます。
これに関して、研究者らは、敵対戦略AIはKataGoに勝つことはできるが、人間のアマチュアには負けるだろうし、同時に人間のアマチュアはKataGoに勝つことはできないと強調した。
言い換えれば、この AI が勝つことができるのは、囲碁が上手だからではなく、KataGo に重大な間違いを引き起こす可能性があるからです。
この前、KataGo や AlphaZero などチェスをプレイする AI はすべてセルフプレイを通じて訓練されます。
しかし、著者が「被害者プレイ」と呼ぶこの研究では、攻撃者 (敵対者) は固定された被害者 (犠牲者) と対話する必要があります ゲームをプレイして独自の勝利戦略を訓練する(相手の動きを真似しないでください)。
これに応えて、研究者たちは、この問題を解決するために 2 つの異なる敵対的 MCTS (A-MCTS) 戦略を導入しました。
具体的には、A-MCTS-R では、研究者は、A-MCTS-S の被害者サンプリング ステップを置き換えて、被害者ノード上で新しい (再帰的) MCTS 検索を使用してシミュレーションします。
これはもはや完璧な被害者モデルではありませんが、被害者が検索しないと誤って想定している A-MCTS-S よりも正確である傾向があります。
#評価結果は以下の通りです。具体的な内容については原文をご参照ください。
以上が人間は再びトップの囲碁AIに勝つことができるでしょうか?風に逆らう一手でアマチュア四段が完勝したの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。