Maison > Périphériques technologiques > IA > le corps du texte

Les humains peuvent-ils à nouveau battre le meilleur Go AI ? D'un seul coup contre le vent, ce joueur d'échecs amateur 4ème dan a complètement gagné

WBOY
Libérer: 2023-04-11 13:34:03
avant
1513 Les gens l'ont consulté

2016 est l'année de l'essor de l'intelligence artificielle.

Depuis qu'AlphaGo a battu le champion du monde de Go Lee Sedol, les joueurs représentant le plus haut niveau de Go ne sont plus humains.

Cependant, un article du Financial Times d’aujourd’hui a ramené Go dans l’horizon des gens : les humains ont trouvé un moyen de vaincre l’IA !

Les humains peuvent-ils à nouveau battre le meilleur Go AI ? Dun seul coup contre le vent, ce joueur déchecs amateur 4ème dan a complètement gagné

Après 7 ans de dormance, les joueurs d'échecs humains vont-ils faire leur grand retour ?

Go fait son grand retour contre toute attente, les humains battent l'IA ?

FT a rapporté que Kellin Pelrine, un joueur d'échecs amateur quatre dan des États-Unis, a vaincu le meilleur joueur d'échecs AI-KataGo d'un seul coup.

Sur 15 parties hors ligne, Perline a remporté 14 parties sans l'aide d'un ordinateur.

Et ce plan permettant aux joueurs humains de retrouver la couronne de Go est venu des chercheurs de la société de recherche californienne FAR AI. L'équipe a analysé les faiblesses des joueurs d'échecs IA et les a ciblés pour remporter la victoire finale.

Adam Gleave, PDG de FAR AI, a déclaré : "Il est très facile pour nous d'exploiter ce système.

Gleave a déclaré que l'IA développée par l'équipe a joué plus d'un million de jeux avec KataGo Later." un "bug" a été découvert que les joueurs humains pourraient exploiter.

Pelrine a déclaré que la stratégie gagnante qu'ils ont découverte n'est "pas si difficile pour les humains" et que les joueurs intermédiaires peuvent l'utiliser pour vaincre les machines. Il a également utilisé cette méthode pour vaincre Leela Zero, un autre système de Go de premier ordre.

Les humains peuvent-ils à nouveau battre le meilleur Go AI ? Dun seul coup contre le vent, ce joueur déchecs amateur 4ème dan a complètement gagné

Kellin Pelrine

FT écrit que malgré l'aide des ordinateurs, cette victoire décisive a ouvert la porte aux joueurs d'échecs humains.

Il y a sept ans, l'intelligence artificielle avait des kilomètres d'avance sur les humains dans les jeux les plus complexes.

​Le système AlphaGo conçu par DeepMind a battu le champion du monde de Go Lee Sedol 4-1 en 2016. Lee Sedol a également annoncé sa retraite trois ans après la défaite désastreuse, qualifiant AlphaGo d'"imbattable".

Pelrine n'est pas d'accord avec la force de l'intelligence artificielle. Selon lui, le grand nombre de combinaisons et de variations dans une partie d'échecs signifie qu'il est impossible pour un ordinateur d'évaluer tous les mouvements futurs possibles d'un joueur d'échecs.

Pour faire simple, la stratégie utilisée par Pelrine est « attaquer à l'est et attaquer à l'ouest ».

D'un côté, Pelrine place des pierres dans tous les coins de l'échiquier pour confondre l'IA ; de l'autre, Pelrine cible une zone du joueur d'échecs de l'IA et l'entoure progressivement.

Les humains peuvent-ils à nouveau battre le meilleur Go AI ? Dun seul coup contre le vent, ce joueur déchecs amateur 4ème dan a complètement gagné

Pelrine a déclaré que même si le siège était sur le point d'être terminé, les joueurs d'échecs de l'IA n'avaient pas remarqué le danger dans cette zone. Il a poursuivi : "Mais en tant qu'humains, ces vulnérabilités sont faciles à trouver."

Stuart Russell, professeur d'informatique à l'Université de Californie à Berkeley, a déclaré que certaines des consoles de jeux Go les plus avancées présentaient des failles. faiblesses, ce qui montre que la vulnérabilité qui prend en charge les systèmes d'apprentissage profond d'aujourd'hui de l'IA de pointe est fondamentalement défectueuse.

Il a déclaré que ces systèmes ne peuvent que « comprendre » les situations spécifiques qu'ils ont vécues, et ne peuvent pas faire de simples généralisations sur les stratégies comme les humains.

La seule qui peut vaincre l'IA est l'IA !

Mais à proprement parler, les chercheurs ont vaincu l’IA grâce à l’IA, ou en d’autres termes, ont utilisé l’IA pour aider les humains à vaincre l’IA au Go.

L'article utilisé comme source de référence a été publié pour la première fois en novembre 2022 et mis à jour en janvier de cette année. Les auteurs viennent du MIT, de l'UC Berkeley et d'autres institutions.

Dans l'article, les chercheurs ont formé une IA avec une stratégie résistante et ont vaincu le système d'intelligence artificielle Go le plus avancé, KataGo.

Les humains peuvent-ils à nouveau battre le meilleur Go AI ? Dun seul coup contre le vent, ce joueur déchecs amateur 4ème dan a complètement gagné

Adresse du projet : https://goattack.far.ai/adversarial-policy-katago#contents

Adresse papier : https://arxiv.org/abs/2211.00241

Les résultats montrent que lorsque KataGo n'utilise pas d'arbres de recherche, l'attaquant atteint un taux de victoire de 100 % sur 1 000 parties, et lorsque KataGo utilise suffisamment de recherches, le taux de victoire dépasse 97 %.

À cet égard, les chercheurs ont souligné que la stratégie contradictoire de l'IA peut vaincre KataGo, mais qu'elle sera vaincue par des amateurs humains. En même temps, les amateurs humains ne peuvent pas battre KataGo.

En d'autres termes, cette IA peut gagner non pas parce qu'elle joue mieux à Go, mais parce qu'elle peut inciter KataGo à commettre de graves erreurs.

Les humains peuvent-ils à nouveau battre le meilleur Go AI ? Dun seul coup contre le vent, ce joueur déchecs amateur 4ème dan a complètement gagné

Stratégie d'attaque

Avant cela, les IA jouant aux échecs telles que KataGo et AlphaZero étaient entraînées via des jeux personnels.

Mais dans cette étude, que l'auteur appelle « jeu de victime », l'attaquant (l'adversaire) doit s'entraîner pour gagner en jouant à des jeux avec une stratégie de victime (victime) fixe (sans copier les mouvements de votre adversaire).

En réponse, les chercheurs ont introduit deux stratégies MCTS contradictoires (A-MCTS) différentes pour résoudre ce problème.

  • Échantillon A-MCTS-S : Le processus de recherche défini par le chercheur est le suivant : lorsque la victime joue aux échecs, échantillon du réseau stratégique de la victime, lorsque c'est le tour de l'attaquant, échantillon de l'échantillonnage du réseau stratégique de l'attaquant ;
  • A-MCTS-R récursif : Puisque l'A-MCTS-S sous-estime la force de la victime, les chercheurs proposent une nouvelle stratégie A-MCTS-R. Cependant, ce changement augmente la complexité informatique de la formation et de l’inférence pour l’attaquant.

Plus précisément, dans A-MCTS-R, les chercheurs utiliseront une nouvelle recherche MCTS (récursive) sur le nœud victime pour effectuer des simulations, remplaçant ainsi l'échantillonnage des victimes dans l'étape A-MCTS-S.

Bien qu'il ne s'agisse plus d'un modèle de victime parfait, il a tendance à être plus précis que l'A-MCTS-S, qui suppose à tort que la victime ne recherche pas.

Les humains peuvent-ils à nouveau battre le meilleur Go AI ? Dun seul coup contre le vent, ce joueur déchecs amateur 4ème dan a complètement gagné

Les résultats de l'évaluation sont les suivants, veuillez vous référer au texte original pour plus de détails.

Les humains peuvent-ils à nouveau battre le meilleur Go AI ? Dun seul coup contre le vent, ce joueur déchecs amateur 4ème dan a complètement gagné

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Étiquettes associées:
source:51cto.com
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal
À propos de nous Clause de non-responsabilité Sitemap
Site Web PHP chinois:Formation PHP en ligne sur le bien-être public,Aidez les apprenants PHP à grandir rapidement!