Pembelajaran tanpa pengawasan ialah kaedah pembelajaran mesin yang tidak menggunakan contoh berlabel dan bertujuan untuk menemui corak atau struktur dalam data. Algoritma hanya disediakan dengan data input dan menemui struktur data itu sendiri.
Algoritma ini digunakan untuk mengumpulkan sampel ke dalam kelompok berdasarkan persamaannya. Matlamat pengelompokan adalah untuk membahagikan data kepada kumpulan supaya contoh dalam setiap kumpulan mempunyai persamaan yang tinggi.
Terdapat banyak kaedah pengelompokan, termasuk kaedah berasaskan centroid, kaedah berasaskan kepadatan dan kaedah hierarki. Kaedah berasaskan centroid, seperti k-means, membahagikan data ke dalam kelompok K, di mana setiap kelompok ditakrifkan oleh centroid (iaitu, contoh yang mewakili). Kaedah berasaskan kepadatan, seperti DBSCAN, membahagikan data kepada kelompok berdasarkan kepadatan contoh. Kaedah hierarki, seperti pengelompokan aglomeratif, membina struktur hierarki kelompok di mana setiap contoh pada mulanya dianggap sebagai kelompoknya sendiri dan kemudian kelompok itu digabungkan bersama berdasarkan persamaannya.
Algoritma pengurangan dimensi ialah teknik yang digunakan untuk mengurangkan bilangan ciri dalam set data. Matlamatnya adalah untuk mengurangkan kerumitan data dan mengelakkan overfitting sambil mengekalkan sebanyak mungkin maklumat. Dalam pembelajaran mesin, algoritma pengurangan dimensi sering digunakan untuk meningkatkan prestasi algoritma pembelajaran. Selain itu, ia juga boleh digunakan untuk visualisasi data, dengan mengurangkan bilangan dimensi dan memetakan data ke dalam ruang berdimensi lebih rendah, menjadikan data lebih mudah untuk diurus dan dilukis.
Terdapat banyak kaedah untuk pengurangan dimensi, termasuk kaedah linear dan kaedah bukan linear. Kaedah linear termasuk teknik seperti analisis komponen utama (PCA) dan analisis diskriminasi linear (LDA), yang mencari gabungan linear ciri yang menangkap varians maksimum dalam data. Kaedah bukan linear termasuk teknik seperti t-SNE dan ISOMAP, yang mengekalkan struktur tempatan data.
Selain kaedah linear dan bukan linear, terdapat juga kaedah pemilihan ciri (memilih subset ciri yang paling penting) dan kaedah pengekstrakan ciri (mengubah data menjadi ruang baharu dengan dimensi yang lebih sedikit).
Ini adalah sejenis pembelajaran tanpa pengawasan yang melibatkan mengenal pasti contoh yang luar biasa atau tidak dijangka berbanding dengan data yang lain. Algoritma pengesanan anomali sering digunakan untuk pengesanan penipuan atau mengenal pasti peralatan yang rosak. Terdapat banyak kaedah untuk pengesanan anomali, termasuk kaedah statistik, kaedah berasaskan jarak dan kaedah berasaskan kepadatan. Kaedah statistik melibatkan pengiraan sifat statistik data, seperti min dan sisihan piawai, dan mengenal pasti contoh yang berada di luar julat tertentu. Kaedah berasaskan jarak melibatkan pengiraan jarak antara contoh dan sebahagian besar data, dan mengenal pasti contoh yang terlalu jauh. Kaedah berasaskan ketumpatan melibatkan mengenal pasti contoh dalam kawasan berketumpatan rendah data
Pengekod auto ialah sejenis rangkaian saraf yang digunakan untuk pengurangan dimensi. Ia berfungsi dengan mengekodkan data input ke dalam perwakilan dimensi rendah dan kemudian menyahkodnya kembali ke ruang asal. Autoencoders biasanya digunakan untuk tugas seperti pemampatan data, denoising dan pengesanan anomali. Ia amat berguna untuk set data yang berdimensi tinggi dan mempunyai sejumlah besar ciri, kerana mereka boleh mempelajari perwakilan dimensi rendah bagi data yang menangkap ciri yang paling penting.
Algoritma ini digunakan untuk mempelajari pengedaran data dan menjana contoh baharu yang serupa dengan data latihan. Beberapa model generatif yang popular termasuk Generative Adversarial Networks (GAN) dan Variational Autoencoders (VAEs). Model generatif mempunyai banyak aplikasi, termasuk penjanaan data, penjanaan imej dan pemodelan bahasa. Ia juga digunakan untuk tugas seperti pemindahan gaya dan resolusi super imej.
Algoritma ini digunakan untuk menemui hubungan antara pembolehubah dalam set data. Ia sering digunakan dalam analisis troli beli-belah untuk mengenal pasti item yang kerap dibeli. Algoritma pembelajaran peraturan persatuan yang popular ialah algoritma Apriori.
Peta penyusunan diri (SOM) ialah seni bina rangkaian saraf yang digunakan untuk visualisasi dan pembelajaran ciri. Ia adalah algoritma pembelajaran tanpa pengawasan yang boleh digunakan untuk menemui struktur dalam data berdimensi tinggi. SOM biasanya digunakan untuk tugas seperti visualisasi data, pengelompokan dan pengesanan anomali. Ia amat berguna untuk menggambarkan data berdimensi tinggi dalam ruang dua dimensi kerana ia boleh mendedahkan corak dan perhubungan yang mungkin tidak kelihatan dalam data asal.
Atas ialah kandungan terperinci Memperkenalkan algoritma pembelajaran tanpa pengawasan yang biasa digunakan. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!