Selbstüberwachtes Lernen (SSL) ist eine Form des überwachten Lernens, bei dem keine manuelle Eingabe von Datenetiketten erforderlich ist. Ergebnisse werden durch Modelle erzielt, die Daten selbstständig analysieren, Informationen kennzeichnen und klassifizieren, ohne dass ein menschliches Eingreifen erforderlich ist. Diese Methode kann den Arbeitsaufwand für manuelle Anmerkungen reduzieren, die Trainingseffizienz verbessern und bei großen Datensätzen eine gute Leistung erbringen. SSL ist eine vielversprechende Lernmethode, die in verschiedenen Bereichen wie Computer Vision und Verarbeitung natürlicher Sprache angewendet werden kann.
Selbstüberwachtes Lernen ist eine unbeaufsichtigte Lernmethode, die unbeschriftete Daten verwendet, um Überwachungssignale zu generieren. Einfach ausgedrückt trainiert es ein Modell, indem es hochzuverlässige Datenetiketten generiert und diese Etiketten dann in der nächsten Iteration verwendet. In jeder Iteration ändert sich die auf den Datenetiketten basierende Grundwahrheit. Dieser Ansatz kann unbeschriftete Daten effektiv nutzen, um die Modellleistung zu verbessern.
Überwachtes Lernen erfordert die Verwendung hochwertiger, manuell gekennzeichneter Daten, um das Modell zu trainieren und die Modellgewichte anzupassen.
Selbstüberwachtes Lernen nutzt Daten und automatisch generierte Labels, um das Modell zu trainieren, ohne echte Labels am Anfang.
Unüberwachtes Lernen funktioniert mit Datensätzen, für die keine Labels verfügbar sind. Dieses Lernparadigma versucht, die bereitgestellten Daten zu verstehen, ohne in jeder Phase des Trainings Labels zu verwenden.
Selbstüberwachtes Lernen ist eine Teilmenge des unüberwachten Lernens, die beide nur unstrukturierte Daten liefern. Beim unüberwachten Lernen geht es jedoch um Clustering, Gruppierung und Dimensionsreduktion, während selbstüberwachtes Lernen wie andere überwachte Modelle Aufgaben wie Klassifizierung, Segmentierung und Regression ausführt.
Energiebasierte Modelle (EBM)
Energiebasierte Modelle versuchen, die Kompatibilität zwischen zwei gegebenen Eingaben mithilfe mathematischer Funktionen zu berechnen. Wenn das EBM bei zwei Eingängen einen niedrigen Energieausgang erzeugt, bedeutet dies, dass die Eingänge eine hohe Kompatibilität aufweisen; ein hoher Energieausgang bedeutet eine hohe Inkompatibilität.
Joint Embedding Architecture
Joint Embedding Architecture ist ein Netzwerk mit zwei Zweigen, bei dem die Struktur jedes Zweigs gleich ist. Jeder Zweig erhält zwei Eingaben, um seine individuellen Einbettungsvektoren zu berechnen. An der Spitze des Netzwerks befindet sich ein Modul, das zwei Einbettungsvektoren als Eingabe verwendet und deren Abstand im latenten Raum berechnet.
Wenn also zwei Eingaben einander ähnlich sind, sollte der berechnete Abstand klein sein. Netzwerkparameter können einfach angepasst werden, um sicherzustellen, dass die Eingaben im latenten Raum nahe beieinander liegen.
Kontrastives Lernen
Beim kontrastiven Lernen von SSL wird das Modell trainiert, indem Eingaben, sogenannte „Anker“, wie Text, Bilder, Videoclips, mit positiven und negativen Beispielen verglichen werden. Positive Stichproben beziehen sich auf Stichproben, die zur gleichen Verteilung wie der Ankerpunkt gehören, während sich negative Stichproben auf Stichproben beziehen, die zu einer anderen Verteilung als der Ankerpunkt gehören.
Nicht kontrastives selbstüberwachtes Lernen (NC-SSL)
Nicht kontrastives selbstüberwachtes Lernen (NC-SSL) ist ein Lernparadigma, bei dem im Gegensatz dazu nur positive Stichprobenpaare zum Trainieren des Modells verwendet werden gleichzeitige Verwendung positiver Proben Das kontrastierende Lernen unterscheidet sich zwischen Paaren und negativen Probenpaaren. Es hat sich jedoch gezeigt, dass NC-SSL in der Lage ist, nicht-triviale Darstellungen mit nur positiven Paaren mithilfe zusätzlicher Prädiktoren und dem Stoppen von Gradientenoperationen zu lernen.
Das obige ist der detaillierte Inhalt vonDer Zusammenhang und der Unterschied zwischen selbstüberwachtem Lernen, überwachtem Lernen und unüberwachtem Lernen (Klassifizierung des selbstüberwachten Lernrahmens). Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!