Apabila saiz set data meningkat, kecekapan algoritma k-nerest neighbor berkurangan, yang memberi kesan kepada prestasi model keseluruhan. Oleh itu, ia digunakan terutamanya dalam sistem pengesyoran mudah, pengecaman corak, perlombongan data dan bidang lain.
Sama seperti algoritma lain, algoritma jiran terhampir k juga mempunyai kelebihan dan kekurangan. Pembangun perlu memilih berdasarkan projek dan senario aplikasi.
1. Kemudahan pelaksanaan: Memandangkan kesederhanaan dan ketepatan algoritma, ia merupakan salah satu pengelas pertama yang akan dipelajari oleh saintis data baharu.
2 Mudah menyesuaikan diri: Algoritma akan menyesuaikan mengikut sampel latihan baharu dan menyesuaikan diri dengan mana-mana data baharu, kerana data latihan disimpan dalam ingatan.
3 Beberapa hiperparameter: Algoritma k-nerest neighbor hanya memerlukan nilai ak dan metrik jarak, yang sangat rendah berbanding algoritma pembelajaran mesin yang lain.
Algoritma k terdekat memerlukan lebih banyak memori dan storan data daripada algoritma lain, jadi ia mempunyai kebolehskalaan yang lemah.
Algoritma ini sangat mahal dari perspektif kos kerana ia memerlukan lebih banyak memori dan ruang storan, meningkatkan perbelanjaan perniagaan dan masa pengiraan mungkin lebih lama.
2 Terdapat kutukan dimensi: Algoritma jiran k-terdekat sering mengalami kutukan dimensi, yang bermaksud ia berprestasi buruk apabila memasukkan data dimensi tinggi.
k algoritma jiran terdekat terdedah kepada overfitting kerana kutukan dimensi. Pemilihan ciri dan teknik pengurangan dimensi boleh mengurangkan pemasangan berlebihan, tetapi nilai k mempengaruhi tingkah laku model.
Nilai k yang lebih rendah mungkin melebihi data, manakala nilai k yang lebih tinggi cenderung untuk melicinkan ramalan atau bahkan kurang sesuai.
Atas ialah kandungan terperinci Kebaikan dan keburukan k algoritma jiran terdekat. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!