Ein neues Modell, das selbst Amateur-Schachspieler nicht schlagen kann, hat tatsächlich die stärkste Go-KI der Welt besiegt – KataGo?
Ja, dieses umwerfende Ergebnis stammt aus den neuesten Veröffentlichungen des MIT, der UC Berkeley usw.
Die Forscher nutzten gegnerische Angriffsmethoden, um die blinden Flecken von KataGo zu nutzen, und basierend auf dieser Technologie besiegte ein Go-Programm auf Anfängerniveau KataGO erfolgreich.
Ohne Suche erreicht diese Gewinnquote sogar 99 %.
Nach all dieser Berechnung lautete die Nahrungskette in der Go-Welt sofort: Amateurspieler > Neue KI > Top-Go-KI?
Moment mal, wie wird diese magische neue KI gleichzeitig so gut?
Gewitzter Angriffswinkel
Bevor wir die neue KI vorstellen, lernen wir zunächst den Protagonisten kennen, der dieses Mal angegriffen wurde – KataGo.
KataGo, die derzeit leistungsstärkste Open-Source-Go-KI, wurde von Harvard-KI-Forschern entwickelt.
Zuvor besiegte KataGo ELF OpenGo und Leela Zero auf übermenschlichem Niveau, und selbst ohne Suchmaschine entsprach sein Niveau dem der 100 besten professionellen Go-Spieler in Europa.
Shin Jin-soo, der koreanische Go-Spieler „Nummer eins“, der gerade den Samsung Cup gewonnen und „vier Kronen in drei Jahren“ gewonnen hat, nutzt KataGo zum Sparring.
△Bildquelle: Hangame
Angesichts eines so starken Gegners kann man sagen, dass die von den Forschern gewählte Methode überwältigend war.
Sie fanden heraus, dass KataGo Go zwar durch das Spielen von Millionen von Spielen gegen sich selbst gelernt hat, dies jedoch immer noch nicht ausreichte, um alle möglichen Situationen abzudecken.
Dieses Mal entscheiden sie sich also nicht mehr für das Selbstspiel, sondern für die gegnerische Angriffsmethode:
Lassen Sie den Angreifer (Gegner) und das feste Opfer (Opfer, auch bekannt als KataGo) ein Spiel spielen und verwenden Sie diese Methode trainiere den Angriff wer.
Diese Änderung ermöglichte es ihnen, eine durchgängige gegnerische Richtlinie zu trainieren, wobei nur 0,3 % der zum Training von KataGo verwendeten Daten verwendet wurden.
Konkret geht es bei dieser Gegenstrategie nicht ausschließlich ums Spielen, sondern darum, das Spiel vorzeitig zu beenden, indem KataGo dazu gebracht wird, einen Zug in einer für den Angreifer günstigen Position zu platzieren.
Nehmen Sie das Bild unten als Beispiel. Der Angreifer, der die schwarzen Steine kontrolliert, platziert Steine hauptsächlich in der oberen rechten Ecke des Spielbretts, überlässt andere Bereiche KataGo und platziert auch absichtlich einige Steine in anderen Bereichen, die leicht zu räumen sind .
Adam Gleave, Co-Autor des Papiers, stellte vor:
Dieser Ansatz lässt KataGo fälschlicherweise glauben, dass es gewonnen hat, da sein Territorium (unten links) viel größer ist als das seines Gegners.
Aber der Bereich in der unteren linken Ecke trägt nicht wirklich zur Wertung bei, da es dort noch Sonnenflecken gibt, was bedeutet, dass er nicht ganz sicher ist.
Weil KataGo zu sehr von seinem Sieg überzeugt ist und glaubt, dass es gewinnen wird, wenn das Spiel endet und die Punkte berechnet werden, ergreift KataGo die Initiative zum Passen, und dann passt auch der Angreifer, wodurch das Spiel beendet und begonnen wird Punktzahl. (Beide Seiten passen und das Spiel endet)
Aber wie von Gleave analysiert, werden die schwarzen Steine im umgebenden Raum von KataGo nicht als „tote Steine“ gemäß den Go-Schiedsrichterregeln gewertet, da sie noch am Leben sind, es gibt also Plätze Für schwarze Steine im umgebenden Raum von KataGo kann None als effektive Maschenzahl berechnet werden.
Der endgültige Gewinner ist also nicht KataGo, sondern der Angreifer.
Dieser Sieg ist kein Einzelfall. Ohne Suche erreichte diese Gegenmaßnahme eine Gewinnquote von 99 % gegen KataGo.
Als KataGo genügend Suchanfragen nutzte, um übermenschliche Level zu erreichen, erreichte die Gewinnrate 50 %.
Außerdem ist das Angreifermodell selbst trotz dieser cleveren Strategie nicht sehr stark im Go: Tatsächlich kann es von menschlichen Amateuren leicht besiegt werden.
Die Forscher gaben an, dass der Zweck ihrer Forschung darin bestand, zu beweisen, dass selbst hoch ausgereifte KI-Systeme schwerwiegende Schwachstellen aufweisen können, indem sie eine unerwartete Schwachstelle in KataGo angreifen.
Wie Co-Autor Gleave sagte:
(Diese Studie) unterstreicht die Notwendigkeit besserer automatisierter Tests von KI-Systemen, um Fehlermodi im schlimmsten Fall zu entdecken, anstatt nur die Leistung im allgemeinen Fall zu testen.
Forschungsteam
Das Forschungsteam kommt vom MIT, der UC Berkeley usw. Die Co-Autoren des Artikels sind Tony Tong Wang und Adam Gleave.
Tony Tong Wang, Doktorand in Informatik am MIT, hat Erfahrung als Praktikant bei NVIDIA, Genesis Therapeutics und anderen Unternehmen.
Adam Gleave ist Doktorand in künstlicher Intelligenz an der University of California, Berkeley. Er schloss sein Studium mit einem Master- und einem Bachelor-Abschluss ab. Seine Hauptforschungsrichtung ist die Robustheit des Deep Learning.
Der Link zum Papier ist am Ende beigefügt, interessierte Freunde können es abholen~
Papierlink: https://arxiv.org/abs/2211.00241
Referenzlink: https://arstechnica. com /information-technology/2022/11/new-go-playing-trick-defeats-world-class-go-ai-but-loss-to-human-amateurs/
Das obige ist der detaillierte Inhalt vonDie Go-KI, die Shen Zhenzhen als Partner besiegte, aber gegen einen menschlichen Amateurspieler verlor. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!