MySQL データベースを機械学習タスクに使用するにはどうすればよいですか?
ビッグデータ時代の到来により、機械学習アルゴリズムはさまざまな分野で広く使用されています。データのストレージと管理の中核ツールの 1 つとして、MySQL データベースも重要な役割を果たします。では、機械学習タスクに MySQL データベースを使用するにはどうすればよいでしょうか?この記事では、機械学習タスクに MySQL データベースを使用する一般的な方法を読者に紹介し、対応するコード例を示します。
1. データの準備
機械学習タスクを実行する前に、まずトレーニングとテストに使用できるデータ セットを準備する必要があります。 MySQL データベースでは、SQL ステートメントを使用してデータをクエリし、結果を CSV または JSON 形式のファイルにエクスポートできます。以下は、MySQL データベースからデータを取得し、結果を CSV ファイルとして保存するためのサンプル コードです:
import pandas as pd import pymysql.cursors # 连接MySQL数据库 connection = pymysql.connect( host='localhost', user='root', password='your_password', db='your_database', charset='utf8mb4', cursorclass=pymysql.cursors.DictCursor ) # 执行SQL查询语句 sql = "SELECT * FROM your_table" df = pd.read_sql(sql, connection) # 保存数据为CSV文件 df.to_csv('data.csv', index=False)
2. データのロードと前処理
データ セットを読み込んだ後、Load が必要です。データを前処理します。これには、データのクリーニング、欠損値の補充などが含まれます。データのロードと前処理のサンプル コードは次のとおりです:
import pandas as pd from sklearn.model_selection import train_test_split from sklearn.preprocessing import StandardScaler # 加载数据 df = pd.read_csv('data.csv') # 分离特征和标签 X = df.drop('label', axis=1) y = df['label'] # 划分训练集和测试集 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0) # 特征标准化 scaler = StandardScaler() X_train = scaler.fit_transform(X_train) X_test = scaler.transform(X_test)
3. モデルのトレーニングと評価
データのロードと前処理が完了したら、機械学習アルゴリズムを使用してモデルを構築できます。トレーニングと評価を実施します。以下は、ロジスティック回帰アルゴリズムを使用したモデルのトレーニングと評価のサンプル コードです:
from sklearn.linear_model import LogisticRegression from sklearn.metrics import accuracy_score # 创建模型 model = LogisticRegression() # 模型训练 model.fit(X_train, y_train) # 模型预测 y_pred = model.predict(X_test) # 模型评估 accuracy = accuracy_score(y_test, y_pred) print('Accuracy:', accuracy)
IV. モデルの保存とロード
トレーニングが完了したら、モデルを MySQL データベースに保存できます。 、その後の使用のために。以下は、モデルを MySQL データベースに保存するためのサンプル コードです。
import pickle import pymysql.cursors # 保存模型 with open('model.pkl', 'wb') as f: pickle.dump(model, f) # 连接MySQL数据库 connection = pymysql.connect( host='localhost', user='root', password='your_password', db='your_database', charset='utf8mb4', cursorclass=pymysql.cursors.DictCursor ) # 保存模型到数据库 with open('model.pkl', 'rb') as f: model_data = f.read() sql = "INSERT INTO your_table (model) VALUES (%s)" connection.execute(sql, (model_data,)) connection.commit()
予測のためにモデルをロードする必要がある場合、モデルを MySQL データベースから読み取り、ロードして使用できます。以下は、MySQL データベースからモデルをロードして予測を行うためのサンプル コードです。
import pickle import pymysql.cursors # 连接MySQL数据库 connection = pymysql.connect( host='localhost', user='root', password='your_password', db='your_database', charset='utf8mb4', cursorclass=pymysql.cursors.DictCursor ) # 加载模型 sql = "SELECT model FROM your_table" connection.execute(sql) model_data = connection.fetchone()['model'] model = pickle.loads(model_data) # 使用模型进行预测 y_pred = model.predict(X_test)
上記は、機械学習タスクに MySQL データベースを使用するための一般的な方法と対応するコード例です。この記事が読者の役に立ち、実際に柔軟に使用できることを願っています。機械学習は継続的な学習と探索のプロセスです。読者の皆様が新しい手法やテクノロジーを探索し続け、機械学習の分野での能力を向上できることを願っています。
以上が機械学習タスクに MySQL データベースを使用するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。