Python ialah bahasa pengaturcaraan popular yang digunakan secara meluas dalam bidang sains data dan pembelajaran mesin. Antaranya, algoritma regresi merupakan alat yang sangat berguna yang boleh digunakan untuk meramalkan nilai pembolehubah berangka. Dalam artikel ini, kami akan menerangkan cara membuat ramalan menggunakan algoritma regresi dalam Python.
Algoritma regresi ialah teknik pembelajaran mesin yang digunakan untuk meramalkan nilai pembolehubah berangka. Idea asas algoritma regresi adalah untuk membina model matematik berdasarkan data yang diketahui yang boleh meramalkan data yang tidak diketahui. Dalam Python, algoritma regresi yang biasa digunakan termasuk regresi linear, regresi polinomial, regresi rabung, regresi Lasso dan regresi ElasticNet.
Dalam artikel ini, kami akan mengambil algoritma regresi linear sebagai contoh untuk memperkenalkan cara menggunakan Python untuk ramalan. Algoritma regresi linear ialah algoritma regresi yang biasa digunakan. Idea asasnya adalah untuk menyesuaikan data dengan fungsi linear untuk meminimumkan ralat antara nilai yang dipasang dan nilai sebenar.
Pertama, kita perlu mengimport perpustakaan berkaitan Python, termasuk NumPy, Pandas dan Scikit-learn.
import numpy as np import pandas as pd from sklearn.linear_model import LinearRegression from sklearn.model_selection import train_test_split
Seterusnya, kita perlu menyediakan set data. Dalam artikel ini, kami akan menggunakan set data tiruan yang mengandungi satu pembolehubah tidak bersandar dan satu pembolehubah bersandar.
data = pd.DataFrame({'x': [1, 2, 3, 4, 5], 'y': [2, 4, 5, 4, 5]})
Kemudian, kami membahagikan set data kepada set latihan dan set ujian.
X_train, X_test, y_train, y_test = train_test_split(data[['x']], data['y'], test_size=0.2, random_state=0)
Seterusnya, kami akan membina model regresi linear dan menyesuaikannya dengan set latihan.
regressor = LinearRegression() regressor.fit(X_train, y_train)
Kini kami mempunyai model terlatih yang boleh kami gunakan untuk membuat ramalan. Katakan kita ingin meramalkan nilai y apabila x ialah 6.
prediction = regressor.predict([[6]]) print(prediction)
Melalui kod di atas, kami mendapat nilai ramalan 5.2.
Kami juga boleh menggunakan model untuk meramal set ujian dan mengira ketepatan keputusan ramalan.
y_pred = regressor.predict(X_test) accuracy = regressor.score(X_test, y_test) print(y_pred) print(accuracy)
Dalam artikel ini, kami merangkumi langkah asas untuk membuat ramalan menggunakan algoritma regresi linear dalam Python. Melalui langkah ini, kita boleh membina model matematik berdasarkan data yang diketahui dan membuat ramalan pada data yang tidak diketahui. Selain algoritma regresi linear, terdapat banyak algoritma regresi lain yang boleh digunakan untuk ramalan, dan pembaca boleh mempelajari dan mencubanya sendiri. Akhir sekali, kita perlu ambil perhatian bahawa apabila menggunakan algoritma regresi untuk ramalan, kita perlu memberi perhatian kepada pembersihan data dan pemilihan ciri untuk mengelakkan masalah seperti overfitting.
Atas ialah kandungan terperinci Bagaimana untuk menggunakan algoritma regresi untuk ramalan dalam Python?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!