Übersetzer |. Li Rui
Rezensent |. Sun Shujuan
verstehtdie Spielregeln nicht. Aber Diese App versteht, dass sie danach strebt, ein Ziel zu erreichen, nämlich im Spiel zu gewinnen. Da das Computerprogramm die Regeln nicht kennt, sind die Züge, mit denen Sie anfangen, Schach zu spielen, zufällig. Einige dieser Tricks sind völlig bedeutungslos und werden für Sie leicht zu gewinnen sein. Nehmen wir an, dass es Ihnen so viel Spaß macht, mit diesem Freund Schach zu spielen, dass Sie süchtig nach dem Spiel sind.
Aber das Computerprogramm wird irgendwann gewinnen, weil es nach und nach Wege und Tricks lernen wird, um dich zu besiegencount. Obwohl dieses hypothetische Szenario
weit hergeholt erscheinen mag, sollte es Ihnen ein grundlegendes Verständnis dafür vermitteln, wie Reinforcement Learning (ein Bereich des maschinellen Lernens) im Allgemeinen funktioniert. Wie intelligent ist Reinforcement Learning? Die menschliche Intelligenz umfasst viele Eigenschaften, darunter den Erwerb von Wissen, den Wunsch, intellektuelle Fähigkeiten zu erweitern, und intuitives Denken. Die menschliche Intelligenz wurde in Zweifel gezogen, als Schachweltmeister Garry Kasparov gegen einen IBM-Computer namens Deep Blue verlor. Apokalyptische Szenarien, die eine Zukunft darstellen, in der Roboter die Menschheit beherrschen, erregen nicht nur die Aufmerksamkeit der Öffentlichkeit, sondern beherrschen auch das Mainstream-Bewusstsein. Allerdings ist „Deep Blue“
kein gewöhnlicher Gegner. Schach spielenmit diesem
ist wie Schach spielen mit einem tausendjährigen alten
Mann, der ununterbrochen Schach gespielt hat. Sein ganzes Leben lang . Aber „Deep Blue“ ist gut darin, ein bestimmtes Spiel zu spielen, nicht aber andere intellektuelle Aktivitäten wie das Spielen eines Instruments, ein Buch schreiben, die Durchführung wissenschaftlicher Experimente, Kindererziehung oder das Reparieren von Autos. Dies soll auf keinen Fall die Errungenschaften von „Deep Blue“ schmälern . Im Gegensatz zu bedarf die Vorstellung, dass Computer den Menschen an intellektuellen Fähigkeiten übertreffen können, einer sorgfältigen Prüfung, beginnend mit einer Analyse, wie Reinforcement Learning funktioniert . Wie Reinforcement Learning funktioniert? kumulative Belohnungen.
Einfach ausgedrückt: Bestärkendes LernenRoboter werden mit einem Belohnungs- und Bestrafungsmechanismus trainiert, Sie werden für richtige Handlungen belohnt, und falsche Handlungen werden für falsche Handlungen bestraft. Reinforcement Learning Bots „denken“ nicht, wie man bessere Maßnahmen ergreifen kann, sie machen einfach alle Maßnahmen möglich, um die Erfolgsaussichten zu maximieren.
Der Hauptnachteil des Reinforcement Learning besteht darin, dass es den Einsatz einer großen Menge an Ressourcen erfordert, um seine Ziele zu erreichen. Der Erfolg des Reinforcement Learning im Go-Spiel verdeutlicht diesen Punkt. Hierbei handelt es sich um ein beliebtes Spiel für zwei Spieler, bei dem das Ziel darin besteht, mit den eigenen Figuren die größtmögliche Fläche auf dem Spielbrett zu besetzen und gleichzeitig den Verlust von Figuren zu vermeiden.
AlphaGo Master ist ein Computerprogramm, das menschliche Spieler im Go-Spiel schlägt. Es verbraucht viel Geld und Arbeitskraft, darunter viele Ingenieure, sehr umfangreiche Spielerfahrung sowie 256 GPUs und 128.000 CPUs.
In den Prozess zu lernen, wie man das Spiel gewinnt, müssen viele Ressourcen und Energie investiert werden. Das wirft die Frage auf: Ist es sinnvoll, eine KI zu entwickeln, die nicht intuitiv denken kann? Sollte die KI-Forschung nicht versuchen, die menschliche Intelligenz zu imitieren? KI verhält sich wie ein Mensch und ihr Einsatz zur Lösung komplexer Probleme erfordert eine Weiterentwicklung. Gegen Reinforcement Learning spricht dagegen, dass sich die KI-Forschung darauf konzentrieren sollte, Maschinen dazu zu bringen, Dinge zu tun, zu denen derzeit nur Menschen und Tiere in der Lage sind. Aus dieser Perspektive ist der Vergleich zwischen künstlicher Intelligenz und menschlicher Intelligenz angebracht.
Quantum Reinforcement LearningReinforcement Learning ist ein aufstrebendes Feld, das angeblich einige der oben genannten Probleme lösen kann. Quantum Reinforcement Learning (QRL) ist eine Methode zur Beschleunigung des Rechnens.
Erstens soll Quantum Reinforcement Learning (QRL) das Lernen beschleunigen, indem die Phasen der Exploration (Entdeckung der Strategie) und Exploitation (Auswahl der besten Strategie) optimiert werden. Einige aktuelle Anwendungen und vorgeschlagene Quantencomputer verbessern die Datenbanksuche, faktorisieren große Zahlen in Primzahlen und vieles mehr.
Obwohl Quantum Reinforcement Learning (QRL) nicht auf bahnbrechende Weise entstanden ist, verspricht es, einige der größten Herausforderungen des konventionellen Reinforcement Learning zu lösen.
Business Case für Reinforcement Learning
Die Fähigkeit, das Lernen zu stärken, kann begrenzt sein, aber es wird nicht überbewertet. Darüber hinaus nehmen mit der Zunahme von Forschungs- und Entwicklungsprojekten für Reinforcement Learning auch die potenziellen Anwendungsfälle in nahezu allen Wirtschaftszweigen zu.
Die groß angelegte Einführung von Reinforcement Learning hängt von mehreren Faktoren ab, darunter der Optimierung des Algorithmusdesigns, der Konfiguration der Lernumgebung usw Verfügbarkeit von Rechenleistung.
Originaltitel: Wird Verstärkungslernen überbewertet? Aleksandras Šulženko 🎜 🎜#
Das obige ist der detaillierte Inhalt vonWird Verstärkungslernen überbewertet?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!