Latihan kendiri ialah kaedah pengelasan separa penyeliaan yang merangkumi andaian kelancaran dan pengelompokan. Oleh itu, ia juga dipanggil pelabelan kendiri atau pembelajaran berorientasikan keputusan.
Secara amnya, latihan kendiri ialah pilihan yang baik apabila set data berlabel mengandungi banyak maklumat tentang proses penjanaan data dan sampel tidak berlabel hanya digunakan untuk memperhalusi algoritma.
Namun, apabila syarat ini tidak dipenuhi, hasil latihan kendiri adalah tidak ideal. Oleh itu latihan kendiri sangat bergantung pada sampel berlabel.
Setiap langkah latihan kendiri melabelkan data tidak berlabel mengikut fungsi keputusan semasa dan melatih semula menggunakan ramalan.
Latih sendiri algoritma agar sesuai dengan pseudo-label yang diramalkan oleh model seliaan lain yang dipelajari sebelum ini.
Peristiwa data dibahagikan kepada set latihan dan set ujian, dan algoritma pengelasan dilatih pada data latihan berlabel. Nilaikan titik data dan gunakan vektor keyakinan untuk mewakili ramalan.
2 Pilih nilai K teratas yang dikaitkan dengan keyakinan maksimum dan tambahkannya pada set data berlabel.
3 Pengelas meramalkan label kelas bagi contoh data ujian berlabel dan menilai prestasi pengelas menggunakan metrik yang dipilih.
4. Pengelas dilatih semula menggunakan set data berlabel baharu.
Latihan kendiri mengeksploitasi struktur set data berlabel untuk menemui hiperpermukaan pemisahan yang sesuai. Selepas proses ini, sampel tidak berlabel dinilai dan mata terkelas dengan keyakinan yang mencukupi dimasukkan ke dalam set latihan baharu Algoritma latihan kendiri mengulangi proses ini sehingga setiap titik data dikelaskan.
Atas ialah kandungan terperinci Konsep latihan kendiri dan kaitannya dengan pembelajaran separa penyeliaan. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!