Das Konzept des Selbsttrainings und seine Verbindung zum halbüberwachten Lernen

WBOY
Freigeben: 2024-01-23 17:15:05
nach vorne
677 Leute haben es durchsucht

Das Konzept des Selbsttrainings und seine Verbindung zum halbüberwachten Lernen

Selbsttraining ist eine halbüberwachte Klassifizierungsmethode, die Glätte- und Clustering-Annahmen umfasst. Daher wird es auch Selbstkennzeichnung oder entscheidungsorientiertes Lernen genannt.

Im Allgemeinen ist Selbsttraining eine gute Wahl, wenn der beschriftete Datensatz viele Informationen über den Datengenerierungsprozess enthält und die unbeschrifteten Proben nur zur Feinabstimmung des Algorithmus verwendet werden.

Wenn diese Bedingungen jedoch nicht erfüllt sind, sind die Ergebnisse des Selbsttrainings nicht ideal. Daher hängt das Selbsttraining stark von gekennzeichneten Proben ab.

Jeder Schritt des Selbsttrainings kennzeichnet unbeschriftete Daten gemäß der aktuellen Entscheidungsfunktion und trainiert sie mithilfe von Vorhersagen neu.

Wie Selbsttraining funktioniert

Trainieren Sie selbst einen Algorithmus, um Pseudo-Labels anzupassen, die von einem anderen zuvor erlernten überwachten Modell vorhergesagt wurden.

Selbsttraining hat diese Schlüsselpunkte

Dateninstanzen werden in Trainingssätze und Testsätze unterteilt, und der Klassifizierungsalgorithmus wird anhand der gekennzeichneten Trainingsdaten trainiert. Werten Sie Datenpunkte aus und verwenden Sie Konfidenzvektoren, um Vorhersagen darzustellen.

2. Wählen Sie die höchsten K-Werte aus, die mit der maximalen Konfidenz verbunden sind, und fügen Sie sie dem beschrifteten Datensatz hinzu.

3. Der Klassifikator sagt die Klassenbezeichnung der gekennzeichneten Testdateninstanz voraus und bewertet die Klassifikatorleistung anhand der ausgewählten Metrik.

4. Der Klassifikator wird mithilfe des neuen gekennzeichneten Datensatzes neu trainiert.

Selbsttraining nutzt die Struktur gekennzeichneter Datensätze, um geeignete Trennungshyperflächen zu entdecken. Nach diesem Vorgang werden unbeschriftete Stichproben ausgewertet und klassifizierte Punkte mit ausreichender Sicherheit in den neuen Trainingssatz aufgenommen. Der Selbsttrainingsalgorithmus wiederholt diesen Vorgang, bis jeder Datenpunkt klassifiziert ist.

Das obige ist der detaillierte Inhalt vonDas Konzept des Selbsttrainings und seine Verbindung zum halbüberwachten Lernen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Verwandte Etiketten:
Quelle:163.com
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage