Python是一種廣泛應用於資料科學和機器學習領域的程式語言。邏輯迴歸是一種常見的機器學習演算法,可以在分類問題的情況下進行預測。在本文中,我們將使用Python實作邏輯迴歸,並使用一個實例來說明其應用。 」
一、邏輯迴歸簡介
邏輯迴歸是一種常見的機器學習演算法,通常用於在分類問題的情況下進行預測。其基礎是利用一個邏輯函數將數據擬合為線性方程,然後將結果映射到[0,1]之間,得到機率值。當機率值大於或等於一個閾值時,我們將該結果預測為正類,否則預測為負類。
二、邏輯迴歸的實作
在Python中,我們可以使用你NumPy,Pandas和Scikit-learn等函式來實作邏輯迴歸。以下是一個範例程式碼:
import numpy as np import pandas as pd from sklearn.linear_model import LogisticRegression from sklearn.model_selection import train_test_split # 读取数据集 data = pd.read_csv('data.csv') # 划分数据集为训练集和测试集 X_train, X_test, y_train, y_test = train_test_split(data[['feature1', 'feature2', 'feature3']], data['target'], test_size=0.3, random_state=42) # 创建逻辑回归模型对象 logreg = LogisticRegression() # 训练模型 logreg.fit(X_train, y_train) # 预测测试集 y_pred = logreg.predict(X_test) # 输出模型准确度 print('模型准确度为:', (y_pred == y_test).mean())
三、邏輯迴歸的實例
在這個例子中,我們考慮一個二元分類問題:根據三個特徵值預測一個人是否有購買一個商品的可能性。我們的資料集包含了一些已知結果的樣本。使用這個資料集來訓練我們的模型,然後對測試集進行預測,看看模型的準確度。
資料集有三個特徵:購買意願,購買力和購買習慣。每個特徵都是連續值。目標變數是二元的,表示是否購買商品。下面是一個範例資料集:
Feature1 | |||
---|---|---|---|
# #Feature2 | |||
Target | #2 | ||
4 | 1 | 3 | |
#3 | 1 | 1 | |
1 | 0 | #2 | |
# 3 | 1 | 3 | |
4 | 1 | #2 | |
2 | 0 | 1 | ##2|
0 | 1 | 1 | |
0 | #3 | 2 |
1
#1
##110###############我們可以利用Scikit-learn函式庫將資料讀取為一個Pandas資料幀,並將其分割為訓練集和測試集:###import pandas as pd from sklearn.model_selection import train_test_split from sklearn.metrics import accuracy_score # 读取数据集 data = pd.read_csv('data.csv') # 划分数据集为训练集和测试集 X_train, X_test, y_train, y_test = train_test_split(data[['feature1', 'feature2', 'feature3']], data['target'], test_size=0.3, random_state=42)
from sklearn.linear_model import LogisticRegression # 创建逻辑回归模型对象 logreg = LogisticRegression() # 训练模型 logreg.fit(X_train, y_train)
# 预测测试集 y_pred = logreg.predict(X_test) # 输出模型准确度 print('模型准确度为:', accuracy_score(y_test, y_pred))
以上是Python中的邏輯迴歸實例的詳細內容。更多資訊請關注PHP中文網其他相關文章!