AIC (Akaike Information Criterion) dan BIC (Bayesian Information Criterion) adalah kriteria pemilihan model yang biasa digunakan untuk membandingkan model yang berbeza dan memilih model yang paling sesuai dengan data. Matlamat kedua-dua kriteria adalah untuk mencari keseimbangan antara kebaikan kesesuaian dan kerumitan model untuk mengelakkan masalah overfitting atau underfitting. AIC dicadangkan oleh Hirotugu Akaike Ia berdasarkan konsep teori maklumat dan mempertimbangkan keseimbangan antara kebaikan kesesuaian model dan bilangan parameter. Formula pengiraan AIC ialah AIC = -2log(L) + 2k, di mana L mewakili anggaran kemungkinan maksimum model dan k mewakili bilangan parameter model. BIC telah dicadangkan oleh Gideon E. Schwarz dan berdasarkan Bayesian
AIC dan BIC adalah penunjuk yang digunakan untuk menimbang kecergasan dan kerumitan model dan boleh digunakan untuk pelbagai model statistik, termasuk kaedah Pengelompokan. Walau bagaimanapun, bentuk khusus AIC dan BIC mungkin berbeza disebabkan oleh pelbagai jenis kaedah pengelompokan dan andaian tentang pengedaran data.
Perbezaan utama antara AIC dan BIC ialah cara mereka menimbang pertukaran antara kebaikan kesesuaian dan kerumitan.
AIC adalah berdasarkan prinsip kemungkinan maksimum, yang menghukum model dengan sejumlah besar parameter berbanding saiz data.
Formula AIC
AIC=2k-2ln(L)
Matlamatnya adalah untuk mencari model dengan nilai AIC terendah untuk mengimbangi kebaikan kesesuaian dan kerumitan. dengan k ialah bilangan parameter model, yang merupakan kemungkinan maksimum model L.
BIC serupa dengan AIC, tetapi ia menghukum model dengan bilangan parameter yang lebih besar dengan lebih teruk.
Formula BIC
BIC=kln(n)-2ln(L)
di mana k ialah n bilangan parameter dalam model, ialah bilangan titik data, dan L ialah kemungkinan maksimum model. Matlamatnya adalah untuk mencari model dengan nilai BIC yang paling rendah, kerana ini menunjukkan bahawa model tersebut mempunyai keseimbangan terbaik antara kesesuaian dan kerumitan.
Secara amnya, BIC akan menghukum model dengan bilangan parameter yang banyak dengan lebih teruk daripada AIC, jadi BIC boleh digunakan apabila matlamatnya adalah untuk mencari model yang lebih parsimoni.
Dalam konteks pemilihan model, model parsimonious ialah model yang mempunyai bilangan parameter yang kecil tetapi masih sesuai dengan data dengan baik. Matlamat model parsimonious adalah untuk memudahkan model dan mengurangkan kerumitan sambil masih menangkap ciri-ciri penting data. Apabila memberikan tahap ketepatan yang sama, model parsimonius lebih diutamakan berbanding model yang lebih kompleks kerana ia lebih mudah untuk ditafsir, kurang terdedah kepada overfitting dan lebih cekap dari segi pengiraan.
Juga ambil perhatian bahawa kedua-dua AIC dan BIC boleh digunakan untuk membandingkan model yang berbeza dan memilih model terbaik untuk set data tertentu.
Atas ialah kandungan terperinci Perbezaan dan sambungan: AIC dan bBIC. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!