Inspiriert durch groß angelegte Sprachmodellierung wendete Deepmind eine ähnliche Methode an, um einen einzelnen „generalistischen“ Agenten Gato zu erstellen, der multimodale, multitaskige und multiverkörperte Eigenschaften aufweist und 600 verschiedene Missionen ausführen kann. Diese künstliche Intelligenz ist wohl die bisher beeindruckendste All-in-One-Suite für maschinelles Lernen weltweit.
DeepMind erklärte im offiziellen Blog:
„Gato ist eine allgemeine künstliche Intelligenz mit mehreren Modi, mehreren Aufgaben und mehreren Komponenten. Unter den gleichen Netzwerkbedingungen kann es Atari-Spiele spielen, Bildunterschriften hinzufügen usw wird je nach aktueller Situation entscheiden, ob Text ausgegeben, der Roboterarm gedreht, Tasten gedrückt oder andere Markierungen ausgeführt werden sollen. „
Obwohl die Leistung von Gato abzuwarten bleibt. Es scheint mehr zu sein, als alles, was GPT-3 erhoffen konnte erreichen.
Bildquelle: Offizielle Website von DeepMind
GPT-3 ist ein großes Sprachmodell (LLM), das von OpenAI, einem kapitalkräftigen Unternehmen für künstliche allgemeine Intelligenz (AGI), entwickelt wurde. Es wird nicht nur von Microsoft mit Milliarden von Dollar unterstützt, sondern die Regulierung der US-Regierung erlaubt ihm im Grunde alles.
Die künstliche allgemeine Intelligenz (AGI), auf die es sich konzentriert, ist eine Art künstlicher Intelligenz, die über menschliche Intelligenz verfügt und jede intellektuelle Aufgabe ausführen kann, die Menschen erledigen können. Einige Forscher nennen allgemeine künstliche Intelligenz starke KI (starke KI) oder vollständige KI (vollständige KI) oder dass Maschinen die Fähigkeit haben, allgemeine intelligente Aktionen auszuführen. Im Vergleich zu schwacher KI verfügt starke KI über das gesamte Spektrum menschlicher kognitiver Fähigkeiten.
Ursprünglich bestand die Mission von OpenAI darin, eine AGI zu entwickeln und zu steuern, aber die Realität ist, dass alles, was das Unternehmen geschaffen hat, sehr ausgefallenes LLM war, was seiner „ursprünglichen Absicht“ etwas widersprach.
Obwohl GPT-3 und DeepMind’s Gato gleichermaßen beeindruckend sind, erfordern die öffentlichen Bewertungskriterien für sie einige Nuancen.
Weil OpenAI den LLM-Weg auf dem Weg zu AGI einschlägt. Der Grund ist einfach: Niemand weiß, wie man AGI zum Laufen bringt. So wie zwischen der „Entdeckung des Feuers“ und der „Erfindung des Verbrennungsmotors“ viel Zeit verging, so geschah es auch nicht über Nacht, herauszufinden, wie man vom Deep Learning zur AGI übergehen kann. Dennoch kann GPT-3 einige Dinge tun, die wie Menschen aussehen, beispielsweise das Generieren von Text.
Und Gato, das sich selbst als „allgemeine künstliche Intelligenz“ bezeichnet, macht fast dasselbe wie GPT-3. Es integriert lediglich etwas, das sehr ähnlich wie LLM funktioniert, in einen „Zauberer“, der mehr als 600 Tricks ausführen kann. Der Clou ist die Verwendung eines einzigen Sequenzmodells zur Lösung aller Aufgaben, erfordert jedoch eine Erhöhung der Menge und Vielfalt der Trainingsdaten.
Die Fähigkeit des Gato, mehrere Aufgaben auszuführen, ähnelt eher einer Konsole, die 600 verschiedene Spiele speichern kann, als einem Spiel, das man auf 600 verschiedene Arten spielen kann. Es handelt sich nicht um eine allgemeine künstliche Intelligenz, wie es in der Einleitung heißt, sondern sie besteht aus einer Reihe vorab trainierter, schmaler Modelle, die ordentlich gebündelt sind.
Bildquelle: Offizielle Website von DeepMind
Wie Mike Cook von der Forschungsgruppe Knives and Paintbrushes kürzlich Kyle Wiggers von TechCrunch sagte:
„Eine KI wie Gato klingt nach einer ganz anderen Aufgabe. Das ist spannend, weil das Schreiben von Text und die Steuerung eines Roboters für uns ganz anders klingen
Aber in Wirklichkeit unterscheidet es sich nicht so sehr von GPT-3, normalen englischen Text und Python-Code zu verstehen
Nicht, dass dies einfach zu erreichen wäre, aber für einen Außenstehenden Beobachter mag es so klingen, als ob eine KI auch problemlos Tee kochen oder zehn oder fünfzig andere Aufgaben erlernen kann, obwohl sie dies und alle nicht kann.“
Kurz gesagt, Gato und GPT-3 sind beide leistungsstarke künstliche Intelligenz Systeme, aber sie verfügen nicht über die Fähigkeit zur allgemeinen Intelligenz.
DeepMind entwickelt sich seit mehr als zehn Jahren in Richtung AGI, OpenAI startete 2015. Aber keines von beiden löst das erste Problem auf dem Weg zu AGI: den Aufbau einer KI, die ohne Training neue Dinge lernen kann.
Wenn Sie nicht darauf wetten, dass die Entstehung von AGI das Ergebnis von Glück ist, ist es an der Zeit, die Fortschritte dieser Unternehmen im Bereich AGI neu zu bewerten.
Vielleicht ist Gato das fortschrittlichste multimodale künstliche Intelligenzsystem der Welt. Aber DeepMind verfolgt das gleiche Konzept, AGI zu einer Sackgasse zu machen wie OpenAI und macht es nur marktfähiger.
Gato kann durch Marketing möglicherweise mehr Gunst auf dem Verbrauchermarkt gewinnen als Alexa, Siri oder Google Assistant. Allerdings sind Gato und GPT-3 keine praktikableren Einstiegspunkte für AGI als die oben genannten virtuellen Assistenten.
Wenn dies die Art von KI ist, nach der Sie suchen, dann ist das keine schlechte Sache. Allerdings gibt es in Gatos begleitendem Forschungspapier keinerlei Hinweise darauf, dass es sich in die richtige Richtung von AGI bewegt, geschweige denn, dass es sich um ein Sprungbrett zu AGI handelt.
Das obige ist der detaillierte Inhalt vonÜber GPT-3 hinaus brachte DeepMind seinen neuen Favoriten Gato auf den Markt, wurde jedoch in Frage gestellt, weil er „die Suppe ersetzt, ohne die Medizin zu ändern'.. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!