Python ist eine Programmiersprache, die im Bereich Datenwissenschaft und maschinelles Lernen weit verbreitet ist. Die logistische Regression ist ein gängiger Algorithmus für maschinelles Lernen, der Vorhersagen im Zusammenhang mit Klassifizierungsproblemen treffen kann. In diesem Artikel werden wir die logistische Regression mit Python implementieren und ihre Anwendung anhand eines Beispiels veranschaulichen. „
1. Einführung in die logistische Regression
Die logistische Regression ist ein gängiger Algorithmus für maschinelles Lernen, der normalerweise verwendet wird, um Vorhersagen im Zusammenhang mit Klassifizierungsproblemen zu treffen. Sie basiert auf der Verwendung einer logistischen Funktion, um die Daten in eine lineare Gleichung einzupassen. und dann das Ergebnis auf [0,1] abbilden, um den Wahrscheinlichkeitswert zu erhalten. Wenn der Wahrscheinlichkeitswert größer oder gleich einem Schwellenwert ist, sagen wir das Ergebnis als positive Klasse voraus, andernfalls sagen wir es als negative Klasse 2 voraus. Implementierung der logistischen Regression
In Python können wir Bibliotheksfunktionen wie NumPy, Pandas und Scikit-learn verwenden, um die logistische Regression zu implementieren:
import numpy as np import pandas as pd from sklearn.linear_model import LogisticRegression from sklearn.model_selection import train_test_split # 读取数据集 data = pd.read_csv('data.csv') # 划分数据集为训练集和测试集 X_train, X_test, y_train, y_test = train_test_split(data[['feature1', 'feature2', 'feature3']], data['target'], test_size=0.3, random_state=42) # 创建逻辑回归模型对象 logreg = LogisticRegression() # 训练模型 logreg.fit(X_train, y_train) # 预测测试集 y_pred = logreg.predict(X_test) # 输出模型准确度 print('模型准确度为:', (y_pred == y_test).mean())
3. Beispiele für die logistische Regression
In diesem Beispiel haben wir Betrachten Sie ein Problem der binären Regression: Sagen Sie anhand von drei Merkmalswerten voraus, ob eine Person ein Produkt kaufen wird. Verwenden Sie diesen Datensatz, um unser Modell zu trainieren und dann Vorhersagen zu treffen Schauen Sie sich den Testsatz an.
Der Datensatz weist drei Merkmale auf: Kaufabsicht, Kaufkraft und Kaufgewohnheiten. Hier ist ein Beispiel Datensatz. :
Feature2 | Feature3 | Ziel | |
---|---|---|---|
3 | 4 | 1 | |
2 | 3 | 1 | |
3 | 1 | 0 | |
2 | 3 | 1 | |
3 | 4 | 1 | |
2 | 2 | 0 | |
2 | 1 | 0 | |
1 | 2 | 0 | |
2 | 4 | 1 | |
1 | 1 | 0 |
import pandas as pd from sklearn.model_selection import train_test_split from sklearn.metrics import accuracy_score # 读取数据集 data = pd.read_csv('data.csv') # 划分数据集为训练集和测试集 X_train, X_test, y_train, y_test = train_test_split(data[['feature1', 'feature2', 'feature3']], data['target'], test_size=0.3, random_state=42)
Dann haben wir Wir können ein Objekt des Modells erstellen und die Trainingsdaten verwenden, um das Modell anzupassen.
from sklearn.linear_model import LogisticRegression # 创建逻辑回归模型对象 logreg = LogisticRegression() # 训练模型 logreg.fit(X_train, y_train)
Als nächstes verwenden wir die Testdaten, um das Modell vorherzusagen und die Genauigkeit des Modells anhand der Testdaten zu berechnen:
# 预测测试集 y_pred = logreg.predict(X_test) # 输出模型准确度 print('模型准确度为:', accuracy_score(y_test, y_pred))
IV. Zusammenfassung
In diesem Artikel stellen wir die Grundkonzepte der logistischen Regression vor und implementieren sie mithilfe von Python. Experimentelle Ergebnisse zeigen, dass die logistische Regression gut zu binären Klassifizierungsproblemen passen und diese vorhersagen kann Entscheidungen für ähnliche binäre Klassifizierungsprobleme
.Das obige ist der detaillierte Inhalt vonBeispiel für eine logistische Regression in Python. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!