Selbstüberwachtes Lernen (SSL) ist eine Methode des unbeaufsichtigten Lernens, bei der unbeschriftete Daten zum Trainieren eines Modells verwendet werden. Die Kernidee besteht darin, das Modell eine Darstellung der Daten ohne menschliche Etiketten erlernen zu lassen. Sobald ein Modell lernt, Daten darzustellen, kann es auf nachgelagerte Aufgaben mit weniger gekennzeichneten Daten angewendet werden und eine bessere Leistung erzielen als Modelle ohne selbstüberwachtes Lernen. Durch selbstüberwachtes Lernen kann das Modell mithilfe impliziter Informationen in den Daten lernen, beispielsweise durch Vorhersage der Rotation der Daten, Farbänderungen usw. Diese Methode kann ohne gekennzeichnete Daten eine effektive Lernmethode darstellen und ist von großer Bedeutung für die Lösung des Problems des groß angelegten Datentrainings.
1. Generieren Sie programmgesteuert Eingabedaten und Beschriftungen aus unbeschrifteten Daten, basierend auf dem Verständnis der Daten
2. Trainieren Sie das Modell mit den Daten/Beschriftungen aus dem vorherigen Schritt
3. Feinabstimmung: Verwenden Sie das vorab trainierte Modell als anfängliche Gewichte, um die gewünschte Aufgabe zu trainieren.
Selbstüberwachtes Lernen in verschiedenen Bereichen wie Text, Bild/Video , Sprache und Grafik In allen Belangen wurden bemerkenswerte Erfolge erzielt. Es kann uns helfen, die Struktur- und Attributinformationen in Diagrammdaten zu verstehen und nützliche Informationen aus unbeschrifteten Daten zu gewinnen. Daher eignet sich selbstüberwachtes Lernen gut für die Gewinnung unbeschrifteter Daten.
1. Generierungsmethode: Wiederherstellung der ursprünglichen
Informationen, nicht autoregressiv: Markierungen/Pixel maskieren und maskierte Markierungen/Pixel vorhersagen (z. B. maskierte Sprachmodellierung (MLM))
b . Autoregressiv: Den nächsten Marker/das nächste Pixel vorhersagen
2. Vorhersageaufgabe: Beschriftungen basierend auf Verständnis, Clustering oder Erweiterung der Daten entwerfen
a: Den Kontext vorhersagen (z. B. die relative Position von Bildfeldern vorhersagen, vorhersagen, ob das nächste Fragment vorhanden ist). (der nächste Satz)
b: Sagen Sie die ID jeder Stichprobe im Cluster voraus.
c: Sagen Sie den Bilddrehwinkel voraus.
3. Kontrastives Lernen (auch bekannt als kontrastive Instanzunterscheidung): Erstellen Sie eine Binärdatei basierend auf erstellten positiven und negativen Stichprobenpaaren durch Erweiterung Klassifizierungsproblem
4. Bootstrapping-Methode: Verwenden Sie zwei ähnliche, aber unterschiedliche Netzwerke, um dieselbe Darstellung aus erweiterten Paaren derselben Stichprobe zu lernen
5. Regularisierung: Fügen Sie Verlust- und Regularisierungsterme basierend auf Annahmen/Intuitionen hinzu:
a: Positive Paare sollten ähnlich sein
b: Die Ausgabe verschiedener Proben in derselben Charge sollte unterschiedlich sein
Das obige ist der detaillierte Inhalt vonEine ausführliche Untersuchung der selbstüberwachten Lernmethoden von SSL. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!