Kluster hierarki ialah kaedah pembelajaran tanpa pengawasan yang digunakan untuk mengumpulkan objek dalam set data mengikut persamaan. Kaedah ini berfungsi dengan membahagikan set data secara berperingkat kepada subset yang lebih kecil dan lebih kecil, akhirnya membentuk struktur hierarki di mana setiap subset boleh dilihat sebagai gugusan. Pengelompokan hierarki termasuk dua jenis: aglomeratif dan pembahagian. Pengelompokan hierarki aglomeratif bermula dengan setiap objek sebagai gugusan awal dan kemudian secara beransur-ansur menggabungkan gugusan serupa sehingga semua objek digabungkan menjadi satu gugusan. Pengelompokan hierarki schizoidal bermula dengan keseluruhan set data sebagai gugusan awal dan kemudian secara beransur-ansur membahagikan gugusan kepada gugusan yang lebih kecil sehingga setiap objek membentuk gugusan yang berasingan. Kaedah pengelompokan hierarki mampu memberikan fleksibiliti berkenaan bilangan gugusan sambil juga mampu menangkap , dengan menggabungkan secara beransur-ansur gugusan dengan persamaan yang tinggi untuk membentuk gugusan besar atau mencapai bilangan gugusan yang diperlukan. Kaedah ini mempunyai kelebihan untuk menyesuaikan diri dengan gugusan bentuk arbitrari dan tidak memerlukan bilangan gugusan untuk dinyatakan terlebih dahulu. Walau bagaimanapun, ia sangat sensitif kepada bunyi bising dan outlier dan mengalami kerumitan pengiraan yang tinggi. Oleh itu, apabila menggunakan pengelompokan hierarki aglomeratif, data perlu dipraproses untuk menghilangkan hingar dan outlier, manakala perhatian harus diberikan kepada penggunaan sumber pengkomputeran.
Pengelompokan hierarki Schizoid ialah kaedah atas ke bawah yang mencapai pengelompokan dengan membahagikan keseluruhan set data secara beransur-ansur kepada subset yang lebih kecil dan lebih kecil. Ia mempunyai kelebihan kerana tidak sensitif terhadap bunyi dan outlier dan mempunyai kerumitan pengiraan yang rendah. Walau bagaimanapun, kelemahan pengelompokan hierarki schizotypal ialah ia tidak boleh menyesuaikan diri dengan gugusan bentuk sewenang-wenangnya dan memerlukan bilangan gugusan untuk dinyatakan terlebih dahulu.
Inti pengelompokan hierarki ialah pengukuran kesamaan kaedah pengukuran biasa termasuk jarak Euclidean, jarak Manhattan dan persamaan kosinus. Langkah-langkah ini digunakan dalam proses pengelompokan untuk mengira jarak atau persamaan antara kelompok untuk menentukan penggabungan atau pembahagian kelompok. Pengelompokan hierarki membina hierarki pengelompokan dengan menggabungkan atau membahagikan gugusan secara berterusan, dengan setiap peringkat mewakili bilangan gugusan yang berbeza.
Langkah utama algoritma pengelompokan hierarki termasuk:
1. Kira jarak atau matriks persamaan antara sampel.
2. Rawat setiap sampel sebagai kelompok dan bina pokok kelompok awal.
3. Ulangi langkah berikut sehingga gugusan terbentuk:
a. b Cantumkan dua gugusan dengan jarak atau persamaan terkecil.Ringkasnya, pengelompokan hierarki ialah kaedah pembelajaran mesin biasa tanpa pengawasan yang boleh membahagikan set data kepada kelompok berbeza berdasarkan persamaan dan membentuk hierarki pengelompokan. Pengelompokan hierarki aglomeratif dan pengelompokan hierarki pembahagian ialah dua kaedah pengelompokan hierarki yang biasa. Dalam aplikasi, pengelompokan hierarki boleh digunakan dalam pembahagian imej, pengelompokan teks, bioinformatik, analisis rangkaian sosial dan bidang lain.
Atas ialah kandungan terperinci Aplikasi pengelompokan hierarki dalam pembelajaran mesin. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!