Python ialah bahasa pengaturcaraan yang sangat popular dengan keupayaan pengkomputeran saintifik dan pemprosesan data yang hebat menjadikannya digunakan secara meluas dalam bidang analisis data dan pembelajaran mesin. Artikel ini akan memperkenalkan cara menggunakan regresi linear univariat dalam Python untuk pemodelan dan ramalan data, dan menunjukkan aplikasi praktikalnya melalui contoh.
Pertama sekali, apakah regresi linear? Dalam statistik dan pembelajaran mesin, regresi linear ialah kaedah yang digunakan untuk mewujudkan hubungan antara dua pembolehubah. Dalam regresi linear univariat, kita hanya mempunyai satu pembolehubah penjelasan (pembolehubah bebas) dan satu pembolehubah tindak balas (pembolehubah bersandar).
Seterusnya, kami akan memperkenalkan cara menggunakan perpustakaan scikit-learn dalam Python untuk melaksanakan regresi linear univariat. scikit-learn ialah perpustakaan pembelajaran mesin popular yang mengandungi banyak alat untuk pemodelan dan visualisasi data.
Langkah 1: Import perpustakaan dan data
Mula-mula, kita perlu mengimport beberapa perpustakaan. Dalam artikel ini, kami akan menggunakan NumPy, Pandas, Matplotlib dan Scikit-learn.
import numpy sebagai np
import panda sebagai pd
import matplotlib.pyplot sebagai plt
dari sklearn.linear_model import LinearRegression
Seterusnya, kita perlu menyediakan apa yang kita mahu untuk menganalisis data. Dalam contoh ini, kami akan menggunakan set data tentang saiz dan harga rumah, yang merupakan set data yang sangat mudah.
df = pd.DataFrame({'Kawasan': [1400, 1600, 1700, 1875, 1100, 1550, 2350, 2450, print(df)
Outputnya adalah seperti berikut:'价格': [245000, 312000, 279000, 308000, 199000, 219000, 405000, 324000, 319000, 255000]})
1 1600 312000
2 1700 279000> 0 1700 279000 4 1100 199000
5 1550 219000
6 2350 405000
7 2450 324000
8 1425 319000
9 2: Analisis dan visualisasi data
Sekali kita mengimport Data, kita boleh mula melakukan analisis dan visualisasi data Mari kita lukis plot serakan, di mana paksi mendatar ialah kawasan rumah dan paksi menegak ialah harga jualan
plt.scatter(df['. kawasan'], df['price'])
plt.ylabel('price')
plt.show()
Output:
Petak taburan ini memberitahu kita bahawa apabila saiz rumah meningkat, harga jualan juga meningkat Oleh itu, mungkin terdapat hubungan linear antara kedua-dua pembolehubah ini model regresi.
Sekarang, kita boleh mula memasang model regresi linear Dalam scikit-learn, anda perlu menggunakan fungsi LinearRegression() untuk membina model linear = df['price']
Cerun: [126.88610769]
Mintan: 36646.35077294225
Langkah 4: Hasil visualisasi
Ramalan
print('Harga jualan yang diramalkan:', y_pred)
Lukis garis regresi
plt.plot(df['kawasan'], model.predict(df[['kawasan']]) , warna ='r')
plt.xlabel('Kawasan')plt.ylabel('Harga')
plt.show()
Output:
Atas ialah kandungan terperinci Contoh regresi linear univariate dalam Python. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!