


Die Go-KI, die Shen Zhenzhen als Partner besiegte, aber gegen einen menschlichen Amateurspieler verlor
Ein neues Modell, das selbst Amateur-Schachspieler nicht schlagen kann, hat tatsächlich die stärkste Go-KI der Welt besiegt – KataGo?
Ja, dieses umwerfende Ergebnis stammt aus den neuesten Veröffentlichungen des MIT, der UC Berkeley usw.
Die Forscher nutzten gegnerische Angriffsmethoden, um die blinden Flecken von KataGo zu nutzen, und basierend auf dieser Technologie besiegte ein Go-Programm auf Anfängerniveau KataGO erfolgreich.
Ohne Suche erreicht diese Gewinnquote sogar 99 %.
Nach all dieser Berechnung lautete die Nahrungskette in der Go-Welt sofort: Amateurspieler > Neue KI > Top-Go-KI?
Moment mal, wie wird diese magische neue KI gleichzeitig so gut?
Gewitzter Angriffswinkel
Bevor wir die neue KI vorstellen, lernen wir zunächst den Protagonisten kennen, der dieses Mal angegriffen wurde – KataGo.
KataGo, die derzeit leistungsstärkste Open-Source-Go-KI, wurde von Harvard-KI-Forschern entwickelt.
Zuvor besiegte KataGo ELF OpenGo und Leela Zero auf übermenschlichem Niveau, und selbst ohne Suchmaschine entsprach sein Niveau dem der 100 besten professionellen Go-Spieler in Europa.
Shin Jin-soo, der koreanische Go-Spieler „Nummer eins“, der gerade den Samsung Cup gewonnen und „vier Kronen in drei Jahren“ gewonnen hat, nutzt KataGo zum Sparring.
△Bildquelle: Hangame
Angesichts eines so starken Gegners kann man sagen, dass die von den Forschern gewählte Methode überwältigend war.
Sie fanden heraus, dass KataGo Go zwar durch das Spielen von Millionen von Spielen gegen sich selbst gelernt hat, dies jedoch immer noch nicht ausreichte, um alle möglichen Situationen abzudecken.
Dieses Mal entscheiden sie sich also nicht mehr für das Selbstspiel, sondern für die gegnerische Angriffsmethode:
Lassen Sie den Angreifer (Gegner) und das feste Opfer (Opfer, auch bekannt als KataGo) ein Spiel spielen und verwenden Sie diese Methode trainiere den Angriff wer.
Diese Änderung ermöglichte es ihnen, eine durchgängige gegnerische Richtlinie zu trainieren, wobei nur 0,3 % der zum Training von KataGo verwendeten Daten verwendet wurden.
Konkret geht es bei dieser Gegenstrategie nicht ausschließlich ums Spielen, sondern darum, das Spiel vorzeitig zu beenden, indem KataGo dazu gebracht wird, einen Zug in einer für den Angreifer günstigen Position zu platzieren.
Nehmen Sie das Bild unten als Beispiel. Der Angreifer, der die schwarzen Steine kontrolliert, platziert Steine hauptsächlich in der oberen rechten Ecke des Spielbretts, überlässt andere Bereiche KataGo und platziert auch absichtlich einige Steine in anderen Bereichen, die leicht zu räumen sind .
Adam Gleave, Co-Autor des Papiers, stellte vor:
Dieser Ansatz lässt KataGo fälschlicherweise glauben, dass es gewonnen hat, da sein Territorium (unten links) viel größer ist als das seines Gegners.
Aber der Bereich in der unteren linken Ecke trägt nicht wirklich zur Wertung bei, da es dort noch Sonnenflecken gibt, was bedeutet, dass er nicht ganz sicher ist.
Weil KataGo zu sehr von seinem Sieg überzeugt ist und glaubt, dass es gewinnen wird, wenn das Spiel endet und die Punkte berechnet werden, ergreift KataGo die Initiative zum Passen, und dann passt auch der Angreifer, wodurch das Spiel beendet und begonnen wird Punktzahl. (Beide Seiten passen und das Spiel endet)
Aber wie von Gleave analysiert, werden die schwarzen Steine im umgebenden Raum von KataGo nicht als „tote Steine“ gemäß den Go-Schiedsrichterregeln gewertet, da sie noch am Leben sind, es gibt also Plätze Für schwarze Steine im umgebenden Raum von KataGo kann None als effektive Maschenzahl berechnet werden.
Der endgültige Gewinner ist also nicht KataGo, sondern der Angreifer.
Dieser Sieg ist kein Einzelfall. Ohne Suche erreichte diese Gegenmaßnahme eine Gewinnquote von 99 % gegen KataGo.
Als KataGo genügend Suchanfragen nutzte, um übermenschliche Level zu erreichen, erreichte die Gewinnrate 50 %.
Außerdem ist das Angreifermodell selbst trotz dieser cleveren Strategie nicht sehr stark im Go: Tatsächlich kann es von menschlichen Amateuren leicht besiegt werden.
Die Forscher gaben an, dass der Zweck ihrer Forschung darin bestand, zu beweisen, dass selbst hoch ausgereifte KI-Systeme schwerwiegende Schwachstellen aufweisen können, indem sie eine unerwartete Schwachstelle in KataGo angreifen.
Wie Co-Autor Gleave sagte:
(Diese Studie) unterstreicht die Notwendigkeit besserer automatisierter Tests von KI-Systemen, um Fehlermodi im schlimmsten Fall zu entdecken, anstatt nur die Leistung im allgemeinen Fall zu testen.
Forschungsteam
Das Forschungsteam kommt vom MIT, der UC Berkeley usw. Die Co-Autoren des Artikels sind Tony Tong Wang und Adam Gleave.
Tony Tong Wang, Doktorand in Informatik am MIT, hat Erfahrung als Praktikant bei NVIDIA, Genesis Therapeutics und anderen Unternehmen.
Adam Gleave ist Doktorand in künstlicher Intelligenz an der University of California, Berkeley. Er schloss sein Studium mit einem Master- und einem Bachelor-Abschluss ab. Seine Hauptforschungsrichtung ist die Robustheit des Deep Learning.
Der Link zum Papier ist am Ende beigefügt, interessierte Freunde können es abholen~
Papierlink: https://arxiv.org/abs/2211.00241
Referenzlink: https://arstechnica. com /information-technology/2022/11/new-go-playing-trick-defeats-world-class-go-ai-but-loss-to-human-amateurs/
Das obige ist der detaillierte Inhalt vonDie Go-KI, die Shen Zhenzhen als Partner besiegte, aber gegen einen menschlichen Amateurspieler verlor. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

AI Hentai Generator
Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen

Lösen Sie das Problem der Schnittstelle zwischen Drittanbietern, die 403 in der Node.js-Umgebung zurückgeben. Wenn wir Node.js verwenden, um Schnittstellen von Drittanbietern aufzurufen, begegnen wir manchmal einen Fehler von 403 von der Schnittstelle, die 403 zurückgibt ...

Die Methode zum Umgang mit Laravels E -Mail -Versagen zum Senden von Verifizierungscode besteht darin, Laravel zu verwenden ...

So setzen Sie die Berechtigungen von Unixsocket automatisch nach dem Neustart des Systems. Jedes Mal, wenn das System neu startet, müssen wir den folgenden Befehl ausführen, um die Berechtigungen von Unixsocket: sudo ...

Ursachen und Lösungen für Fehler Bei der Verwendung von PECL zur Installation von Erweiterungen in der Docker -Umgebung, wenn die Docker -Umgebung verwendet wird, begegnen wir häufig auf einige Kopfschmerzen ...

Detaillierte Erläuterung der zweidimensionalen Sortier- und Ranking-Implementierung von PHP-PHP In diesem Artikel wird ausführlich erläutert, wie ein zweidimensionales PHP-Array sortiert und jedes Sub-Array gemäß den Sortierergebnissen verwendet wird ...

So implementieren Sie die AES -Verschlüsselung und Entschlüsselung mit Java ...

Methode zum Abholen des Rücksendecode, wenn das Senden von Laravel -E -Mails fehlschlägt. Wenn Sie Laravel zur Entwicklung von Anwendungen verwenden, stellen Sie häufig Situationen auf, in denen Sie Überprüfungscodes senden müssen. Und in Wirklichkeit ...

Wie implementieren Sie die Parameter der Kontextschnittstelle von ChatGPT? Bei der Verwendung von OpenAIs Schnittstelle ist die Funktion der Implementierung einer Frage-und-Antwort-Funktion relativ einfach, und die offizielle Dokumentation enthält auch Details ...
