


Nanda Yu Yangs ausführliche Interpretation: Was ist ein „Weltmodell'?
Da Sora in den Medien hochgespielt wird, wird Sora im Einführungsmaterial von OpenAI wieder als „Weltsimulator“ bezeichnet, aber es gibt nur wenige Artikel, in denen Weltmodelle vorgestellt werden.
Hier überprüfen wir, was ein Weltmodell ist und diskutieren, ob Sora ein Weltsimulator ist.
Was sind Weltmodelle/Weltmodelle?
Wenn im Bereich KI die Wörter Welt/Welt und Umgebung/Environment fallen, geschieht dies meist zur Unterscheidung von Agenten/Agenten.
Die Bereiche mit der meisten Forschung zu Agenten sind Reinforcement Learning und Robotik.
Sie sehen also, dass Weltmodelle und Weltmodellierung am frühesten und am häufigsten in Veröffentlichungen im Bereich Robotik auftauchen.
Das Wort Weltmodelle, das heute den größten Einfluss hat, könnte dieser Artikel mit dem Titel „Weltmodelle“ sein, den Jürgen 2018 auf arxiv gepostet hat. Der Artikel wurde schließlich in NeurIPS'18 veröffentlicht.
Der Artikel definiert nicht, was Weltmodelle sind, sondern stellt eine Analogie zum mentalen Modell des menschlichen Gehirns in der Kognitionswissenschaft her und zitiert dabei Literatur aus dem Jahr 1971.
mentales Modell ist das Spiegelbild des menschlichen Gehirns der umgebenden Welt
Das in Wikipedia eingeführte mentale Modell weist deutlich darauf hin, dass es an Erkenntnis-, Argumentations- und Entscheidungsprozessen beteiligt sein kann. Und wenn es um das mentale Modell geht, besteht es hauptsächlich aus zwei Teilen: mentalen Repräsentationen und mentaler Simulation.
eine interne Darstellung der äußeren Realität, von der angenommen wird, dass sie eine wichtige Rolle bei der Wahrnehmung, dem Denken und der Entscheidungsfindung spielt. Der Begriff wurde 1943 von Kenneth Craik geprägt, der vorschlug, dass der Geist „kleinformatige Modelle“ der Realität konstruiert Es wird verwendet, um Ereignisse zu antizipieren.
An dieser Stelle ist es noch etwas verwirrend, aber das Strukturdiagramm in der Arbeit erklärt deutlich, was ein Weltmodell ist.
In der Abbildung ist das vertikale V->z die niedrigdimensionale Darstellung der Beobachtung, die durch VAE implementiert wird. Das horizontale M->h->M->h ist Durch die Darstellung des vorhergesagten nächsten Moments der Sequenz, implementiert mit RNN, ergeben die beiden Teile das Weltmodell.
Mit anderen Worten, das Weltmodell umfasst hauptsächlich Zustandsrepräsentationen und Übergangsmodelle, die auch mentalen Repräsentationen und mentalen Simulationen entsprechen.
Wenn Sie das Bild oben sehen, denken Sie vielleicht: Sind nicht alle Sequenzvorhersagen Weltmodelle?
Tatsächlich können Schüler, die mit Verstärkungslernen vertraut sind, auf einen Blick erkennen, dass die Struktur dieses Bildes falsch (unvollständig) ist, und die tatsächliche Struktur ist das Bild unten. Die Eingabe von RNN ist nicht nur z, sondern auch Aktion Dies ist nicht die übliche Sequenzvorhersage (wird das Hinzufügen einer Aktion einen großen Unterschied machen? Ja, das Hinzufügen einer Aktion ermöglicht eine freie Änderung der Datenverteilung, was große Herausforderungen mit sich bringt).
Jürgens Artikel gehört zum Bereich des verstärkenden Lernens.
Gibt es also nicht viele modellbasierte RL beim Reinforcement Learning? Was ist der Unterschied zwischen dem Modell und dem Weltmodell? Die Antwort lautet: Es gibt keinen Unterschied, es ist dasselbe. Jürgen hat zuerst etwas gesagt
Die grundlegende Bedeutung ist, dass ich ein RNN-Pionier bin, egal wie viele modellbasierte RL-Arbeiten es gibt, ich habe RNN erfunden, um Modelle zu erstellen, und ich möchte es einfach tun.
In der frühen Version von Jürgens Artikel erwähnte er auch viel modellbasiertes RL. Obwohl er das Modell gelernt hatte, trainierte er RL nicht vollständig im Modell.
Die Tatsache, dass RL nicht vollständig im Modell trainiert ist, ist nicht wirklich der Unterschied zwischen modellbasiertem RL und Modell, sondern die langjährige Frustration der modellbasierten RL-Richtung: Das Modell ist nicht genau genug, und das RL Ganz im Modell trainiert ist der Unterschied sehr effektiv. Dieses Problem wurde erst in den letzten Jahren gelöst.
Smart Sutton hat das Problem ungenauer Modelle schon vor langer Zeit erkannt. Im Jahr 1990 wurde dieses Modell in dem Aufsatz „Integrated Architectures for Learning, Planning and Reacting based on Dynamic Programming“, der das Dyna-Framework vorschlug (veröffentlicht auf ICML, dem ersten Workshop, der eine Konferenz war) als Aktionsmodell bezeichnet, wobei der Schwerpunkt auf der Vorhersage der Ergebnisse lag Aktionsausführung.
RL lernt aus realen Daten (Zeile 3) und gleichzeitig vom Modell (Zeile 5), um ungenaues Modelllernen aufgrund einer schlechten Strategie zu verhindern.
Man sieht, dass das Weltmodell für die Entscheidungsfindung sehr wichtig ist. Wenn Sie ein genaues Weltmodell erhalten können, können Sie durch Ausprobieren im Weltmodell die optimale Entscheidung in der Realität finden.
Dies ist die Kernfunktion des Weltmodells: kontrafaktisches Denken, das heißt, auch für Entscheidungen, die nicht in den Daten sichtbar sind, können die Ergebnisse der Entscheidung im Weltmodell abgeleitet werden.
Studenten, die kausales Denken verstehen, werden mit dem Begriff kontrafaktisches Denken vertraut sein. Im populärwissenschaftlichen Buch „The Book of Why“ wird eine Kausalleiter gezeichnet. Die unterste Ebene ist „Korrelation“. Was die meisten Vorhersagemodelle tun, ist die „Intervention“, und die Erkundung des verstärkenden Lernens ist eine typische Intervention, die die Was-wäre-wenn-Frage durch Vorstellungskraft beantwortet. Das schematische Diagramm, das Judäa für kontrafaktische Überlegungen zeichnete, wurde von Wissenschaftlern in ihrem Gehirn erfunden und ähnelt dem schematischen Diagramm, das Jürgen in seiner Arbeit verwendete.
Links: Schematische Darstellung des Weltmodells in Jürgens Artikel. Rechts: Die Leiter von Ursache und Wirkung im Buch Judäa.
An diesem Punkt können wir zusammenfassen, dass das Streben von KI-Forschern nach Weltmodellen darin besteht, Daten zu transzendieren, kontrafaktische Überlegungen anzustellen und die Fähigkeit anzustreben, Was-wäre-wenn-Fragen zu beantworten. Dies ist eine Fähigkeit, die Menschen von Natur aus besitzen, aber die aktuelle KI ist darin noch sehr dürftig. Sobald ein Durchbruch erzielt wird, werden die Entscheidungsfähigkeiten der KI erheblich verbessert und Szenarioanwendungen wie vollständig autonomes Fahren ermöglicht. "Ist Sora ein Weltsimulator?" echte Welt. OpenAI scheint eine Phrase neu formen zu wollen, aber die Bedeutung bleibt dieselbe.
Das von Sora generierte Video kann nur durch vage Aufforderungswörter geleitet werden, was eine genaue Steuerung erschwert. Daher handelt es sich eher um ein Videotool und es ist schwierig, es als kontrafaktisches Argumentationstool zur genauen Beantwortung von Was-wäre-wenn-Fragen zu verwenden.
Es ist sogar schwierig zu beurteilen, wie stark Soras Generationsfähigkeit ist, da völlig unklar ist, wie unterschiedlich das Demovideo von den Trainingsdaten ist.
Was noch enttäuschender ist, ist, dass diese Demos zeigen, dass Sora die Gesetze der Physik nicht genau gelernt hat. Ich habe gesehen, wie jemand in den von Sora erstellten Videos auf die Inkonsistenz mit physikalischen Gesetzen hingewiesen hat. [OpenAI veröffentlicht Vincent-Videomodell Sora, KI kann die physische Welt in Bewegung verstehen. Ist das ein Weltmodell? Was bedeutet das? ]
Ich denke, die von OpenAI veröffentlichten Demos sollten auf sehr ausreichenden Trainingsdaten basieren, einschließlich der von CG generierten Daten. Dennoch sind die physikalischen Gesetze, die durch Gleichungen mit wenigen Variablen beschrieben werden können, immer noch nicht verstanden.
OpenAI glaubt, dass Sora einen Weg zu Simulatoren der physischen Welt ebnet, aber es scheint, dass das einfache Stapeln von Daten nicht der Weg zu fortschrittlicherer intelligenter Technologie ist.
Das obige ist der detaillierte Inhalt vonNanda Yu Yangs ausführliche Interpretation: Was ist ein „Weltmodell'?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

AI Hentai Generator
Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen



Fügen Sie einer vorhandenen Tabelle in SQL neue Spalten hinzu, indem Sie die Anweisung für die Änderung Tabelle verwenden. Zu den spezifischen Schritten gehören: Ermittlung des Tabellennamens und Spalteninformationen, Schreiben von Alter Tabellenanweisungen und Ausführungsanweisungen. Fügen Sie beispielsweise eine E -Mail -Spalte in die Tabelle der Kunden hinzu (VARCHAR (50)): Änderung der Tabelle Kunden addieren Sie E -Mail -Varchar (50).

Die Syntax zum Hinzufügen von Spalten in SQL ist Alter table table_name add column_name data_type [nicht null] [Standard default_value]; Wenn table_name der Tabellenname ist, ist Column_Name der neue Spaltenname, Data_Type ist der Datentyp, nicht null Gibt an, ob Nullwerte zulässig sind, und Standard Standard_Value gibt den Standardwert an.

Tipps zur Verbesserung der SQL -Tabellenlösungsleistung: Verwenden Sie die Truncate -Tabelle anstelle des Löschens, löschen Sie den Speicherplatz und setzen Sie die Identitätsspalte zurück. Deaktivieren Sie fremde Schlüsselbeschränkungen, um die Kaskadierung der Löschung zu verhindern. Verwenden Sie Transaktionskapselungsvorgänge, um die Datenkonsistenz sicherzustellen. Batch löschen Big Data und begrenzen Sie die Anzahl der Zeilen durch die Grenze. Bauen Sie den Index nach dem Löschen neu auf, um die Effizienz der Abfrage zu verbessern.

Legen Sie den Standardwert für neu hinzugefügte Spalten fest, verwenden Sie die Anweisung für die Änderung der Tabelle: Hinzufügen von Spalten angeben und den Standardwert: Alter Table table_name hinzufügen column_name data_type Standard default_value; Verwenden Sie die Einschränkungsklausel, um den Standardwert anzugeben: Alter Table Table_Name add Column_Name Data_type Einschränkung default_constraint default default_value;

Ja, mit der Anweisung Löschen kann eine SQL -Tabelle gelöscht werden. TABLE_NAME ERSETZEN AUS DER NAME DER TABELLE, DIE DELDET.

Redis -Gedächtnisfragmentierung bezieht sich auf die Existenz kleiner freier Bereiche in dem zugewiesenen Gedächtnis, die nicht neu zugewiesen werden können. Zu den Bewältigungsstrategien gehören: Neustart von Redis: Der Gedächtnis vollständig löschen, aber den Service unterbrechen. Datenstrukturen optimieren: Verwenden Sie eine Struktur, die für Redis besser geeignet ist, um die Anzahl der Speicherzuweisungen und -freisetzungen zu verringern. Konfigurationsparameter anpassen: Verwenden Sie die Richtlinie, um die kürzlich verwendeten Schlüsselwertpaare zu beseitigen. Verwenden Sie den Persistenzmechanismus: Daten regelmäßig sichern und Redis neu starten, um Fragmente zu beseitigen. Überwachen Sie die Speicherverwendung: Entdecken Sie die Probleme rechtzeitig und ergreifen Sie Maßnahmen.

Um eine Datentabelle mithilfe von PHPMYADMIN zu erstellen, sind die folgenden Schritte unerlässlich: Stellen Sie eine Verbindung zur Datenbank her und klicken Sie auf die neue Registerkarte. Nennen Sie die Tabelle und wählen Sie die Speichermotor (innoDB empfohlen). Fügen Sie Spaltendetails hinzu, indem Sie auf die Taste der Spalte hinzufügen, einschließlich Spaltenname, Datentyp, ob Nullwerte und andere Eigenschaften zuzulassen. Wählen Sie eine oder mehrere Spalten als Primärschlüssel aus. Klicken Sie auf die Schaltfläche Speichern, um Tabellen und Spalten zu erstellen.

Das Erstellen einer Oracle -Datenbank ist nicht einfach, Sie müssen den zugrunde liegenden Mechanismus verstehen. 1. Sie müssen die Konzepte von Datenbank und Oracle DBMS verstehen. 2. Beherrschen Sie die Kernkonzepte wie SID, CDB (Containerdatenbank), PDB (Pluggable -Datenbank); 3.. Verwenden Sie SQL*Plus, um CDB zu erstellen und dann PDB zu erstellen. Sie müssen Parameter wie Größe, Anzahl der Datendateien und Pfade angeben. 4. Erweiterte Anwendungen müssen den Zeichensatz, den Speicher und andere Parameter anpassen und die Leistungsstimmung durchführen. 5. Achten Sie auf Speicherplatz, Berechtigungen und Parametereinstellungen und überwachen und optimieren Sie die Datenbankleistung kontinuierlich. Nur indem Sie es geschickt beherrschen, müssen Sie die Erstellung und Verwaltung von Oracle -Datenbanken wirklich verstehen.
