多元線性迴歸是廣泛應用於資料分析和機器學習的統計模型。它透過使用多個自變數來預測一個或多個因變數的值。在Python中,我們可以使用許多不同的函式庫和框架來實作多元線性迴歸模型,例如NumPy、Pandas和Scikit-Learn等。
下面,我們將使用Scikit-Learn庫來建立多元線性迴歸模型,以預測房屋價格。在這個例子中,我們將使用房價資料集的資料。此資料集包含506個樣本和13個自變量,包括城鎮犯罪率、房屋平均房間數、房屋年齡等。
首先,我們需要匯入所需的函式庫和資料集:
import numpy as np import pandas as pd from sklearn.datasets import load_boston boston = load_boston() X = pd.DataFrame(boston.data, columns=boston.feature_names) y = pd.DataFrame(boston.target, columns=['MEDV'])
在這裡,我們使用Pandas函式庫將資料集載入到DataFrame物件中,並將自變數和因變數分別儲存在X和y中。
接下來,我們需要將資料集分成訓練集和測試集。訓練集用於擬合模型,而測試集用於評估模型的性能。
from sklearn.model_selection import train_test_split X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
在這裡,我們使用Scikit-Learn庫中的train_test_split函數將資料集分成訓練集和測試集。我們使用test_size參數指定測試集的大小,並使用random_state參數設定隨機種子以確保結果的可重複性。
接下來,我們可以使用線性迴歸模型來擬合資料集。
from sklearn.linear_model import LinearRegression regressor = LinearRegression() regressor.fit(X_train, y_train)
這裡,我們使用Scikit-Learn庫中的LinearRegression類別來建立一個線性迴歸模型,並使用fit方法來擬合訓練資料。
現在,我們可以使用模型來預測測試集中的房屋價格。
y_pred = regressor.predict(X_test)
在這裡,我們使用predict方法來預測測試集中的房屋價格。
最後,我們可以使用Scikit-Learn函式庫中的一些評估指標來評估模型的表現。
from sklearn.metrics import mean_squared_error, r2_score print('Mean squared error: %.2f' % mean_squared_error(y_test, y_pred)) print('Coefficient of determination: %.2f' % r2_score(y_test, y_pred))
在這裡,我們使用mean_squared_error函數來計算均方誤差,使用r2_score函數來計算決定係數。這些指標可以幫助我們了解模型的效能和準確度。
總之,使用Python進行多元線性迴歸模型設計可以非常簡單。我們只需要匯入所需的庫和資料集,擬合模型並使用一些評估指標來評估模型的效能。在實際應用中,我們需要對資料進行探索性資料分析、特徵工程和模型最佳化,以獲得更好的預測結果。
以上是Python實現多元線性迴歸模型的方法詳解的詳細內容。更多資訊請關注PHP中文網其他相關文章!