Python は、データ サイエンスと機械学習の分野で広く使用されているプログラミング言語です。ロジスティック回帰は、分類問題のコンテキストで予測を行うことができる一般的な機械学習アルゴリズムです。この記事では、Python を使用してロジスティック回帰を実装し、例を使用してそのアプリケーションを説明します。 ”
1. ロジスティック回帰の概要
ロジスティック回帰は、分類問題のコンテキストで予測を行うために通常使用される一般的な機械学習アルゴリズムです。その基礎は、ロジスティック関数を使用して、データを変換して線形方程式に当てはめ、その結果を [0,1] の間にマッピングして確率値を取得します。確率値がしきい値以上の場合、結果は正のクラスとして予測されます。
2. ロジスティック回帰の実装
#Python では、NumPy、Pandas、Scikit-learn などのライブラリ関数を使用してロジスティック回帰を実装できます。サンプルコード:
import numpy as np import pandas as pd from sklearn.linear_model import LogisticRegression from sklearn.model_selection import train_test_split # 读取数据集 data = pd.read_csv('data.csv') # 划分数据集为训练集和测试集 X_train, X_test, y_train, y_test = train_test_split(data[['feature1', 'feature2', 'feature3']], data['target'], test_size=0.3, random_state=42) # 创建逻辑回归模型对象 logreg = LogisticRegression() # 训练模型 logreg.fit(X_train, y_train) # 预测测试集 y_pred = logreg.predict(X_test) # 输出模型准确度 print('模型准确度为:', (y_pred == y_test).mean())
3. ロジスティック回帰の例
この例では、3 つの特徴値に基づいて人が製品を購入する可能性があるかどうかを予測するという 2 項分類問題を検討します。私たちのデータ セットには、「既知の結果を持つサンプルがいくつかあります。このデータ セットを使用してモデルをトレーニングし、テスト セットを予測してモデルの精度を確認します。
データ セットには 3 つの特徴があります: 購入意向、購買力、購入習慣。各特徴は連続値です。ターゲット変数はバイナリで、商品を購入するかどうかを示します。データ セットの例は次のとおりです:
Feature1 | 機能 2 | 機能 3 | ターゲット |
---|---|---|---|
#2 | 3 | 4 | 1 |
3 | 2 | 3 | 1 |
1 | 3 | 1 | 0 |
2 | 3 | 1 | |
3 | 4 | 1 | |
2 | 2 | 0 | |
2 | 1 | 0 | |
1 | 2 | 0 | |
2 | 4 | 1 | ##1 |
1 | 0 |
from sklearn.linear_model import LogisticRegression # 创建逻辑回归模型对象 logreg = LogisticRegression() # 训练模型 logreg.fit(X_train, y_train)
# 预测测试集 y_pred = logreg.predict(X_test) # 输出模型准确度 print('模型准确度为:', accuracy_score(y_test, y_pred))
以上がPython でのロジスティック回帰の例の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。