La régression linéaire est un algorithme d'apprentissage automatique couramment utilisé pour prédire la relation linéaire entre une variable continue et une ou plusieurs variables indépendantes. Cet article présentera le fonctionnement de la régression linéaire et démontrera le processus de prédiction à travers un exemple et du code Python.
La régression linéaire est un algorithme d'apprentissage supervisé qui prédit la valeur d'une variable continue grâce à un ensemble de variables indépendantes (ou caractéristiques). Dans la régression linéaire simple, une seule variable indépendante prédit la valeur de la variable dépendante ; dans la régression linéaire multiple, plusieurs variables indépendantes prédisent la valeur de la variable dépendante. Cet algorithme peut être utilisé pour prédire les valeurs de variables continues telles que les prix des logements et les ventes. En trouvant la droite la mieux ajustée, la régression linéaire peut fournir des prédictions et des explications sur la variable dépendante.
L'idée de base de la régression linéaire est de minimiser l'erreur entre la valeur prédite et la valeur réelle en trouvant la ligne droite la mieux ajustée. La ligne droite peut être exprimée sous la forme y=mx+b, où y représente la variable dépendante, x représente la variable indépendante, m représente la pente et b représente l'origine.
Pour trouver la droite la mieux ajustée, nous utilisons la méthode des moindres carrés. L'idée principale de cette méthode est de trouver une ligne droite qui minimise la somme des distances de tous les points de données par rapport à la ligne droite.
Regardons maintenant un exemple Supposons que nous ayons un ensemble de données représentant la superficie et le prix des maisons dans une certaine ville. Nous souhaitons utiliser la régression linéaire pour prédire le prix d’une superficie d’une maison. On peut utiliser la superficie de la maison comme variable indépendante x et le prix comme variable dépendante y.
Tout d'abord, nous devons importer les bibliothèques et les données nécessaires :
import numpy as np import matplotlib.pyplot as plt # 数据 x = np.array([70, 80, 100, 120, 150, 180, 200]) y = np.array([320, 360, 420, 480, 600, 720, 800])
Ensuite, nous pouvons dessiner un nuage de points des données :
plt.scatter(x, y) plt.xlabel('房屋面积(平方米)') plt.ylabel('价格(万元)') plt.show()
Comme le montrent le nuage de points, la superficie de la maison et prix Il existe une certaine relation linéaire entre eux. Nous pouvons désormais utiliser la régression linéaire pour ajuster les données et prédire le prix de la superficie d’une nouvelle maison.
from sklearn.linear_model import LinearRegression # 创建线性回归模型 model = LinearRegression() # 训练模型 model.fit(x.reshape(-1, 1), y) # 预测房屋面积为120平方米的价格 new_x = np.array([120]) predicted_y = model.predict(new_x.reshape(-1, 1)) print(predicted_y) # 输出 [452.85714286]
Nous utilisons le modèle LinearRegression de la bibliothèque Scikit-learn pour créer un modèle de régression linéaire et l'entraîner à l'aide des données d'entraînement. Ensuite, nous avons utilisé le modèle pour prédire le prix d'une maison neuve d'une superficie de 120 mètres carrés, et le résultat prévu était de 452 857 yuans.
Enfin, nous pouvons tracer la ligne droite d'ajustement et les résultats de la prédiction :
# 绘制拟合直线 line_x = np.linspace(50, 220, 100) line_y = model.predict(line_x.reshape(-1, 1)) plt.plot(line_x, line_y, color='r') #绘制预测结果 plt.scatter(new_x, predicted_y, color='g') # 绘制原始数据 plt.scatter(x, y) # 添加标签和标题 plt.xlabel('房屋面积(平方米)') plt.ylabel('价格(万元)') plt.title('房屋面积与价格的线性关系') plt.show()
Comme le montre la figure ci-dessus, la ligne droite d'ajustement correspond bien aux données et les résultats de la prédiction sont également relativement précis.
Cet article présente le principe de fonctionnement de la régression linéaire et montre comment utiliser Python pour la prédiction de la régression linéaire à travers un exemple pratique. La régression linéaire est un algorithme d'apprentissage automatique simple mais efficace qui peut être utilisé pour résoudre de nombreux problèmes pratiques, tels que la prévision des prix des logements, la prévision des ventes, etc. Dans les applications pratiques, nous devons sélectionner des fonctionnalités et des modèles appropriés en fonction de problèmes spécifiques, et effectuer un prétraitement des données et une optimisation du modèle pour obtenir de meilleurs résultats de prédiction.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!