Hutan rawak menggunakan berbilang pokok klasifikasi untuk mengklasifikasikan vektor input Setiap pokok mempunyai hasil pengelasan, dan klasifikasi dengan bilangan undian tertinggi akhirnya dipilih sebagai keputusan akhir.
Di atas adalah pengenalan kepada hutan rawak Seterusnya, mari kita lihat aliran kerja algoritma hutan rawak.
Langkah 1: Mula-mula pilih sampel rawak daripada set data.
Langkah 2: Untuk setiap sampel, algoritma akan mencipta pepohon keputusan. Kemudian keputusan ramalan setiap pohon keputusan akan diperolehi.
Langkah 3: Setiap hasil yang dijangkakan dalam langkah ini akan diundi.
Langkah 4: Akhir sekali, pilih keputusan ramalan dengan undian terbanyak sebagai keputusan ramalan akhir. Prinsip Algoritma Hutan Rawak
Hutan rawak berprestasi lebih baik daripada pepohon keputusan individu untuk pelbagai item data.
Algoritma hutan rawak mengekalkan ketepatan yang tinggi walaupun apabila sejumlah besar data tiada.
Ciri Rawak Hutan dalam Pembelajaran Mesin
- Algoritma paling tepat yang tersedia pada masa ini.
- Sesuai untuk pangkalan data yang besar.
- Boleh mengendalikan berpuluh-puluh ribu pembolehubah input tanpa memadam mana-mana daripadanya.
Kira kepentingan beberapa pembolehubah dalam pengelasan.
Apabila hutan berkembang, ia menjana anggaran dalaman yang tidak berat sebelah tentang ralat generalisasi.
Menyediakan strategi yang baik untuk meneka data yang hilang, mengekalkan ketepatannya walaupun dalam kes kehilangan data yang besar.
Termasuk kaedah untuk mengimbangi ketidaktepatan set data yang tidak sekata dalam populasi separa. - Hutan yang dicipta boleh disimpan dan digunakan untuk data lain pada masa hadapan.
- Buat prototaip untuk menunjukkan hubungan antara pembolehubah dan kategori.
- Kira jarak antara pasangan contoh, berguna untuk mengelompokkan, mengesan outlier atau memberikan paparan data yang menarik (mengikut skala).
- Data tidak berlabel boleh digunakan untuk membuat pengelompokan tanpa pengawasan, visualisasi data dan pengenalan luar menggunakan ciri di atas.
- Menyediakan mekanisme untuk mencari interaksi berubah-ubah secara eksperimen.
-
-
- Apabila kami melatih model hutan rawak pada set data dengan ciri khusus, objek model yang terhasil boleh memberitahu kami ciri yang paling relevan semasa proses latihan, iaitu ciri yang mempunyai kesan paling besar pada sasaran pembolehubah. Kepentingan pembolehubah ini ditentukan untuk setiap pokok dalam hutan rawak dan kemudian dipuratakan merentasi hutan untuk menghasilkan satu ukuran untuk setiap ciri. Metrik ini boleh digunakan untuk mengisih ciri mengikut kaitan dan melatih semula model hutan rawak kami menggunakan ciri ini sahaja.
Atas ialah kandungan terperinci Aplikasi Hutan Rawak dalam Pembelajaran Mesin. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!