Regression linear ialah kaedah pembelajaran statistik yang biasa digunakan untuk mewujudkan hubungan linear antara pembolehubah bebas dan pembolehubah bersandar. Model ini berdasarkan kaedah kuasa dua terkecil dan mencari penyelesaian optimum dengan meminimumkan jumlah ralat kuasa dua antara pembolehubah bersandar dan pembolehubah bebas. Kaedah ini sesuai untuk situasi di mana terdapat hubungan linear dalam set data dan boleh digunakan untuk meramal dan menganalisis hubungan antara pembolehubah bersandar dan pembolehubah bebas.
Ungkapan matematik model regresi linear adalah seperti berikut:
y=beta_0+beta_1x_1+beta_2x_2+…+beta_px_p+epsilon
mewakili pembolehubah , di mana beta
mewakili , beta_1 , beta_2,… ,beta_p mewakili pekali pembolehubah bebas, x_1,x_2,...,x_p mewakili pembolehubah bebas, dan epsilon mewakili istilah ralat. Matlamat model regresi linear adalah untuk menyelesaikan pekali optimum beta_0, beta_1, ..., beta_p dengan meminimumkan jumlah kuasa dua baki, supaya dapat meminimumkan ralat antara nilai ramalan model dan nilai sebenar. Kaedah kuasa dua terkecil ialah kaedah yang biasa digunakan untuk menganggar pekali ini. Ia menentukan nilai pekali dengan mencari jumlah minimum ralat kuasa dua. Dalam model regresi linear, kami biasanya menggunakan beberapa penunjuk prestasi untuk menilai kesesuaian model, seperti ralat min kuasa dua dan pekali penentuan. MSE mewakili ralat purata antara nilai ramalan dan nilai sebenar, dan R-kuadrat mewakili bahagian varians yang dijelaskan oleh model kepada jumlah varians. Kelebihan model regresi linear ialah ia mudah dan mudah difahami, dan boleh digunakan untuk menerangkan hubungan antara pembolehubah bersandar dan pembolehubah tidak bersandar, tetapi ia juga mempunyai beberapa batasan, seperti kesan pemasangan yang lemah untuk outlier dan data tak linear. Dalam aplikasi praktikal, apabila melakukan analisis regresi linear, kami akan membuat beberapa andaian berdasarkan ciri-ciri masalah sebenar dan set data biasanya berdasarkan aspek berikut: 1 : Kami mengandaikan bahawa terdapat hubungan linear antara pembolehubah sasaran dan pembolehubah tidak bersandar, iaitu garis lurus boleh digunakan untuk menggambarkan hubungan antara kedua-duanya. 2. Andaian Kebebasan: Kami menganggap bahawa setiap titik sampel adalah bebas antara satu sama lain, iaitu nilai pemerhatian antara setiap sampel tidak mempengaruhi satu sama lain. 3. Andaian taburan normal: Kami menganggap bahawa istilah ralat mematuhi taburan normal, iaitu taburan sisa mematuhi taburan normal. 4. Andaian homoskedastisitas: Kami mengandaikan bahawa varians terma ralat adalah sama, iaitu varians baki adalah stabil. 5 Andaian multikolineariti: Kami mengandaikan bahawa tiada korelasi yang tinggi antara pembolehubah bebas, iaitu tiada multikolineariti antara pembolehubah bebas. Apabila melakukan analisis regresi linear, kita perlu menguji andaian ini untuk menentukan sama ada ianya benar. Jika andaian tidak dipenuhi, pemprosesan data yang sepadan atau kaedah analisis regresi lain perlu dipilih.Atas ialah kandungan terperinci Analisis hipotesis dan analisis prinsip model regresi linear. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!