2016 est l'année de l'essor de l'intelligence artificielle.
Depuis qu'AlphaGo a battu le champion du monde de Go Lee Sedol, les joueurs représentant le plus haut niveau de Go ne sont plus humains.
Cependant, un article du Financial Times d’aujourd’hui a ramené Go dans l’horizon des gens : les humains ont trouvé un moyen de vaincre l’IA !
Après 7 ans de dormance, les joueurs d'échecs humains vont-ils faire leur grand retour ?
FT a rapporté que Kellin Pelrine, un joueur d'échecs amateur quatre dan des États-Unis, a vaincu le meilleur joueur d'échecs AI-KataGo d'un seul coup.
Sur 15 parties hors ligne, Perline a remporté 14 parties sans l'aide d'un ordinateur.
Et ce plan permettant aux joueurs humains de retrouver la couronne de Go est venu des chercheurs de la société de recherche californienne FAR AI. L'équipe a analysé les faiblesses des joueurs d'échecs IA et les a ciblés pour remporter la victoire finale.
Adam Gleave, PDG de FAR AI, a déclaré : "Il est très facile pour nous d'exploiter ce système.
Gleave a déclaré que l'IA développée par l'équipe a joué plus d'un million de jeux avec KataGo Later." un "bug" a été découvert que les joueurs humains pourraient exploiter.
Pelrine a déclaré que la stratégie gagnante qu'ils ont découverte n'est "pas si difficile pour les humains" et que les joueurs intermédiaires peuvent l'utiliser pour vaincre les machines. Il a également utilisé cette méthode pour vaincre Leela Zero, un autre système de Go de premier ordre.
Kellin Pelrine
FT écrit que malgré l'aide des ordinateurs, cette victoire décisive a ouvert la porte aux joueurs d'échecs humains.
Il y a sept ans, l'intelligence artificielle avait des kilomètres d'avance sur les humains dans les jeux les plus complexes.
Le système AlphaGo conçu par DeepMind a battu le champion du monde de Go Lee Sedol 4-1 en 2016. Lee Sedol a également annoncé sa retraite trois ans après la défaite désastreuse, qualifiant AlphaGo d'"imbattable".
Pelrine n'est pas d'accord avec la force de l'intelligence artificielle. Selon lui, le grand nombre de combinaisons et de variations dans une partie d'échecs signifie qu'il est impossible pour un ordinateur d'évaluer tous les mouvements futurs possibles d'un joueur d'échecs.
Pour faire simple, la stratégie utilisée par Pelrine est « attaquer à l'est et attaquer à l'ouest ».
D'un côté, Pelrine place des pierres dans tous les coins de l'échiquier pour confondre l'IA ; de l'autre, Pelrine cible une zone du joueur d'échecs de l'IA et l'entoure progressivement.
Pelrine a déclaré que même si le siège était sur le point d'être terminé, les joueurs d'échecs de l'IA n'avaient pas remarqué le danger dans cette zone. Il a poursuivi : "Mais en tant qu'humains, ces vulnérabilités sont faciles à trouver."
Stuart Russell, professeur d'informatique à l'Université de Californie à Berkeley, a déclaré que certaines des consoles de jeux Go les plus avancées présentaient des failles. faiblesses, ce qui montre que la vulnérabilité qui prend en charge les systèmes d'apprentissage profond d'aujourd'hui de l'IA de pointe est fondamentalement défectueuse.
Il a déclaré que ces systèmes ne peuvent que « comprendre » les situations spécifiques qu'ils ont vécues, et ne peuvent pas faire de simples généralisations sur les stratégies comme les humains.
Mais à proprement parler, les chercheurs ont vaincu l’IA grâce à l’IA, ou en d’autres termes, ont utilisé l’IA pour aider les humains à vaincre l’IA au Go.
L'article utilisé comme source de référence a été publié pour la première fois en novembre 2022 et mis à jour en janvier de cette année. Les auteurs viennent du MIT, de l'UC Berkeley et d'autres institutions.
Dans l'article, les chercheurs ont formé une IA avec une stratégie résistante et ont vaincu le système d'intelligence artificielle Go le plus avancé, KataGo.
Adresse du projet : https://goattack.far.ai/adversarial-policy-katago#contents
Adresse papier : https://arxiv.org/abs/2211.00241
Les résultats montrent que lorsque KataGo n'utilise pas d'arbres de recherche, l'attaquant atteint un taux de victoire de 100 % sur 1 000 parties, et lorsque KataGo utilise suffisamment de recherches, le taux de victoire dépasse 97 %.
À cet égard, les chercheurs ont souligné que la stratégie contradictoire de l'IA peut vaincre KataGo, mais qu'elle sera vaincue par des amateurs humains. En même temps, les amateurs humains ne peuvent pas battre KataGo.
En d'autres termes, cette IA peut gagner non pas parce qu'elle joue mieux à Go, mais parce qu'elle peut inciter KataGo à commettre de graves erreurs.
Avant cela, les IA jouant aux échecs telles que KataGo et AlphaZero étaient entraînées via des jeux personnels.
Mais dans cette étude, que l'auteur appelle « jeu de victime », l'attaquant (l'adversaire) doit s'entraîner pour gagner en jouant à des jeux avec une stratégie de victime (victime) fixe (sans copier les mouvements de votre adversaire).
En réponse, les chercheurs ont introduit deux stratégies MCTS contradictoires (A-MCTS) différentes pour résoudre ce problème.
Plus précisément, dans A-MCTS-R, les chercheurs utiliseront une nouvelle recherche MCTS (récursive) sur le nœud victime pour effectuer des simulations, remplaçant ainsi l'échantillonnage des victimes dans l'étape A-MCTS-S.
Bien qu'il ne s'agisse plus d'un modèle de victime parfait, il a tendance à être plus précis que l'A-MCTS-S, qui suppose à tort que la victime ne recherche pas.
Les résultats de l'évaluation sont les suivants, veuillez vous référer au texte original pour plus de détails.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!