ホームページ テクノロジー周辺機器 AI 深真センをパートナーとして破ったものの、人間のアマチュア棋士に負けた囲碁AI

深真センをパートナーとして破ったものの、人間のアマチュア棋士に負けた囲碁AI

Apr 10, 2023 am 08:01 AM
ai 行く アマチュア人間チェスプレイヤー

アマチュアチェスプレイヤーでも勝てない新型モデルが、実は世界最強の囲碁AI「KataGo」を破った?

はい、この驚くべき結果は、MIT、カリフォルニア大学バークレー校などの最新論文から得られたものです。

研究者らは、敵対的攻撃手法を使用して KataGo の死角を掴み、このテクノロジーに基づいて、新人レベルの囲碁プログラムが KataGO を破ることに成功しました。

検索なしでも、この勝率は 99% に達します。

これを計算すると、囲碁界の食物連鎖は瞬時に次のようになります。アマチュア プレイヤー > 新しい AI > トップの囲碁 AI?

ちょっと待ってください、この魔法のような新しい AI はどのようにして同時に非常に優れたものになるのでしょうか?

狡猾な攻撃角度

新しい AI を紹介する前に、まず今回攻撃された主人公である KataGo について理解しましょう。

KataGo は、現在最も強力なオープンソースの囲碁 AI で、ハーバード大学の AI 研究者によって開発されました。

以前、KataGo は超人レベルの ELF OpenGo と Leela Zero を破り、検索エンジンがなくても、そのレベルはヨーロッパのプロ棋士トップ 100 に匹敵しました。

三星杯で優勝し、「3年間で4冠」を達成した韓国の「ナンバーワン」囲碁棋士、シン・ジンジン氏は、スパーリングにKataGoを使用しています。

深真センをパートナーとして破ったものの、人間のアマチュア棋士に負けた囲碁AI

△画像出典:ハンゲーム

これほど強敵を前に、研究者たちが選んだ方法は圧倒的といえる。

彼らは、KataGo が何百万もの対局を行うことで囲碁を学習しましたが、これでは考えられるすべての状況をカバーするにはまだ不十分であることを発見しました。

そこで、今度はセルフゲームを選択するのではなく、対決攻撃方法を選択します:

攻撃者 (敵対者) と固定された被害者 (KataGo とも呼ばれる被害者) を競争させます。ゲームでは、この方法を使用して攻撃者を訓練します。

この変更により、KataGo のトレーニングに使用されるデータのわずか 0.3% を使用して、エンドツーエンドの敵対的ポリシーをトレーニングできるようになりました。

具体的には、この対抗戦略は完全にゲームに関するものではなく、KataGo をだまして攻撃者に有利な位置に誘導することでゲームを途中で終了させます。

たとえば、下の図では、黒石をコントロールする攻撃者は、主に盤の右上隅に石を配置し、その他の領域は KataGo に任せ、また、意図的に他の領域にいくつかの駒を置きます。簡単にクリアできます。

この論文の共著者であるアダム・グリーブ氏は、次のように紹介しています:

このアプローチでは、KataGo が勝ったと誤って思い込ませます。なぜなら、KataGo の領域 (左下) は、その領域 (左下) の方がはるかに大きいからです。対戦相手。

しかし、左下のエリアはまだ黒点があり、完全に安全ではないことを意味するため、実際にはポイントに貢献しません。

深真センをパートナーとして破ったものの、人間のアマチュア棋士に負けた囲碁AI

KataGo は勝利を過信しており、ゲームが終了してスコアが計算されれば勝つと考えているため、KataGo は率先してパスを取り、その後、攻撃者もパスし、ゲームが終了し、得点が始まります。 (両者パスしてゲーム終了)

しかし、Gleaveの分析によると、KataGoの周囲の空間にある黒石はまだ生きているため、囲碁審判規則では「死んだ石」とは判定されない。そのため、周囲の空間にあるKataGoの黒石は生きており、黒点のある場所は有効メッシュ数としてカウントできません。

つまり、最終的な勝者は KataGo ではなく、攻撃側です。

この勝利は特別なものではなく、探索を行わない場合、この対策は KataGo に対して 99% の勝率を達成しました。

KataGo が超人レベルに近づくほど十分な検索を使用したとき、勝率は 50% に達しました。

深真センをパートナーとして破ったものの、人間のアマチュア棋士に負けた囲碁AI

また、この賢い戦略にも関わらず、攻撃者モデル自体は囲碁ではあまり強くありません。実際、素人の人間には簡単に負けてしまいます。

深真センをパートナーとして破ったものの、人間のアマチュア棋士に負けた囲碁AI

研究者らは、研究の目的は、KataGo の予期せぬ脆弱性を攻撃することで、高度に成熟した AI システムにも深刻な脆弱性が存在する可能性があることを証明することであると述べています。

共著者の Gleave 氏は次のように述べています:

(この研究) は、通常の状況下でパフォーマンスをテストするだけでなく、最悪の場合の障害モードを発見するために AI システムの自動テストを改善する必要性を強調しています。

研究チーム

研究チームはMIT、カリフォルニア大学バークレー校などから来ています。論文の共著者はTony Tong WangとAdam Gleaveです。

深真センをパートナーとして破ったものの、人間のアマチュア棋士に負けた囲碁AI

MIT のコンピューター サイエンスの博士課程の学生である Tony Tong Wang は、NVIDIA、Genesis Therapeutics などの企業でインターンとして働いた経験があります。

深真センをパートナーとして破ったものの、人間のアマチュア棋士に負けた囲碁AI

アダム グリーブは、カリフォルニア大学バークレー校の人工知能の博士課程の学生です。ケンブリッジ大学で修士号と学士号を取得して卒業しました。彼の主な研究方向は次のとおりです。深層学習の堅牢性。

深真センをパートナーとして破ったものの、人間のアマチュア棋士に負けた囲碁AI

論文へのリンクは最後に添付されています。興味のある友人はそれを入手してください~

論文へのリンク: https://arxiv .org/abs /2211.00241

参考リンク:https://arstechnica.com/information-technology/2022/11/new-go-playing-trick-defeats-world-class-go-ai-but -人間のアマチュア/

に負ける

以上が深真センをパートナーとして破ったものの、人間のアマチュア棋士に負けた囲碁AIの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

Debianログを介してシステムのパフォーマンスを監視する方法 Debianログを介してシステムのパフォーマンスを監視する方法 Apr 02, 2025 am 08:00 AM

Debianシステムログ監視のマスターは、効率的な動作とメンテナンスの鍵です。システムの動作条件をタイムリーに理解し、障害をすばやく見つけ、システムのパフォーマンスを最適化するのに役立ちます。この記事では、一般的に使用されるいくつかの監視方法とツールを紹介します。 SysStat Toolkitを使用したシステムリソースの監視SysStat Toolkitは、CPUロード、メモリ使用量、ディスクI/O、ネットワークスループットなど、さまざまなシステムリソースメトリックを収集、分析、レポートするための一連の強力なコマンドラインツールを提供します。 MPSTAT:マルチコアCPUの統計。ピドスタ

Debian Syslogのトラブルシューティング方法 Debian Syslogのトラブルシューティング方法 Apr 02, 2025 am 09:00 AM

Syslog for Debian Systemsは、システム管理者が問題を診断するための重要なツールです。この記事では、一般的なSyslogの問題をトラブルシューティングするためのいくつかの手順とコマンドを提供します。1。最新のログのリアルタイム表示:Tail-F/var/log/syslog viewingカーネルログ(スタートエラーとドライバーの問題):DMESGはJournalCtl(Debian8以上、SystemD System)を使用します。 2。システムリソースの監視と表示プロセスとリソースの使用法:Psaux(高いリソース占有プロセスを見つける)リアルタイム監視

DebianのGolangログの回転戦略は何ですか DebianのGolangログの回転戦略は何ですか Apr 02, 2025 am 08:39 AM

Debian Systemsでは、GOのログローテーションは通常、GO標準ライブラリに付属する機能ではなく、サードパーティライブラリに依存しています。 Lumberjackは一般的に使用されるオプションです。さまざまなログフレームワーク(ZapやLogrusなど)で使用して、ログファイルの自動回転と圧縮を実現できます。 LumberJackおよびZAPライブラリを使用したサンプル構成:packagemainimport( "gopk.in/natefinch/lumberjack.v2" "go.uber.org/zap" "go.uber.org/zap/zapcor

GoおよびViperライブラリを使用するときにポインターを渡す必要があるのはなぜですか? GoおよびViperライブラリを使用するときにポインターを渡す必要があるのはなぜですか? Apr 02, 2025 pm 04:00 PM

ポインター構文とviperライブラリの使用における問題への取り組みGO言語でプログラミングするとき、特にポインターの構文と使用を理解することが重要です...

Go Gin Frameworkのすべてのコントローラーがパブリックデータを利用できるようにするにはどうすればよいですか? Go Gin Frameworkのすべてのコントローラーがパブリックデータを利用できるようにするにはどうすればよいですか? Apr 02, 2025 am 10:21 AM

すべてのコントローラーにGogin Frameworkでパブリックデータを取得するにはどうすればよいですか? goを使って...

言語スライスに行く:シングルエレメントスライスインデックス1インターセプトの場合、なぜエラーを報告しないのですか? 言語スライスに行く:シングルエレメントスライスインデックス1インターセプトの場合、なぜエラーを報告しないのですか? Apr 02, 2025 pm 02:24 PM

Go Language Slice Index:エラーなしでインデックス1からシングルエレメントスライスインターセプトがインターセプトされるのはなぜですか? GO言語では、スライスは底部を参照できる柔軟なデータ構造です...

GolangのLinux Iptablesリンクリストに操作を実装する方法は? GolangのLinux Iptablesリンクリストに操作を実装する方法は? Apr 02, 2025 am 10:18 AM

Golangを使用してLinuxを実装しています...

GO言語の範囲を使用してマップを通過してマップを保存するのに、なぜすべての値が最後の要素になるのですか? GO言語の範囲を使用してマップを通過してマップを保存するのに、なぜすべての値が最後の要素になるのですか? Apr 02, 2025 pm 04:09 PM

GOのマップイテレーションにより、すべての値が最後の要素になるのはなぜですか? Go言語では、いくつかのインタビューの質問に直面したとき、あなたはしばしば地図に遭遇します...

See all articles