Matriks kekeliruan ialah alat analisis ramalan yang berkuasa dalam pembelajaran mesin yang digunakan untuk meringkaskan bilangan ramalan yang betul dan salah oleh pengelas dalam tugas pengelasan binari.
Ringkasnya, "Matriks Kekeliruan ialah ukuran prestasi algoritma pembelajaran mesin".
Dengan menggambarkan matriks kekeliruan, kita boleh memerhati nilai pepenjuru untuk menentukan ketepatan model dan menilai bilangan klasifikasi yang tepat.
Jika anda mempertimbangkan struktur matriks, saiz matriks adalah berkadar dengan bilangan kelas keluaran.
Matriks kekeliruan adalah dalam bentuk matriks, dengan lajur mewakili nilai ramalan dan baris mewakili nilai sebenar, meringkaskan hasil ramalan model pengelasan.
Mengukur matriks kekeliruan membantu menilai ketepatan dan jenis ralat model klasifikasi.
1. Memberi maklumat tentang kesilapan yang dilakukan oleh pengelas dan jenis kesilapan yang dilakukan.
2. Renungkan betapa mengelirukan model pengelasan semasa membuat ramalan.
3. Membantu mengatasi had ketepatan pengelasan penempatan berasingan.
4. Matriks kekeliruan sangat sesuai untuk mengira keluk ingatan semula, ketepatan, ketepatan dan AUC-ROC.
1: Ketepatan menerangkan berapa banyak nilai yang diramalkan dengan betul adalah positif. Atau secara ringkasnya, ia memberikan bilangan output yang betul yang diberikan oleh model daripada semua nilai positif yang diramalkan dengan betul.
Ia menentukan sama ada model itu boleh dipercayai, dan formula untuk mengira ketepatan ialah TP/(TP+FP).
2. Ingat: Ingat semula menerangkan bilangan nilai positif sebenar yang diramalkan dengan betul daripada model. Formula untuk mengira kadar ingat semula ialah TP/(TP+FN).
Meningkatkan ketepatan mengurangkan ingatan semula dan sebaliknya, ini dipanggil pertukaran ketepatan/panggil semula.
3 Ketepatan: Ia adalah salah satu parameter penting untuk menentukan ketepatan masalah pengelasan Ia menerangkan kekerapan model meramalkan output yang betul dan boleh mengukur bilangan ramalan yang betul yang dibuat untuk pengelas berbanding yang dibuat oleh pengelas. Nisbah jumlah ramalan. pengelas. Formulanya ialah;
Ketepatan: (TP+TN)/(TP+TN+FP+FN)
4: Untuk situasi di mana dua model mempunyai kepersisan rendah dan panggil semula tinggi atau ketepatan tinggi dan panggil semula rendah. ia adalah sangat mudah untuk Sukar untuk membandingkan model ini, jadi untuk menyelesaikan masalah ini, kita boleh menggunakan F-skor. Skor-F ialah min harmonik ketepatan dan ingatan semula.
Dengan mengira skor-F, kami boleh menilai ingatan dan ketepatan serentak. Tambahan pula, jika ingat semula adalah sama dengan ketepatan, maka skor F adalah maksimum dan boleh dikira menggunakan formula berikut: F-measure= (2*Recall*precision)/ (Recall + Precision)
Atas ialah kandungan terperinci Hubungan antara matriks kekeliruan dan ketepatan, ingat kembali, ketepatan dan F-Measure. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!