scikit-learn を機械学習に使用する方法
機械学習は、コンピューターが自動的に学習してパフォーマンスを向上させるテクノロジーです。分類、回帰、クラスタリングなどのさまざまなタスクに適用できます。 scikit-learn は、機械学習タスクをシンプルかつ効率的に行うための実用的なツールとアルゴリズムを多数提供する人気の Python 機械学習ライブラリです。この記事では、機械学習に scikit-learn を使用する方法を紹介し、いくつかのコード例を示します。
最初のステップは、scikit-learn ライブラリをインストールすることです。 pip コマンドを使用してターミナルにインストールできます。
pip install scikit-learn
インストールが完了したら、機械学習に scikit-learn の使用を開始できます。
まず、必要なライブラリとモジュールをインポートします:
from sklearn import datasets from sklearn.model_selection import train_test_split from sklearn import svm from sklearn import metrics
その後、scikit-learn によって提供されるデータ セットを使用して機械学習を実行できます。ここでは例として iris データ セットを取り上げます。データ セット内の
iris = datasets.load_iris() X = iris.data y = iris.target
XX は特徴行列を表し、y はターゲット変数を表します。次に、データ セットをトレーニング セットとテスト セットに分割します。
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
上記のコードは、データ セットの 80% をトレーニング セットとして使用し、20% をテスト セットとして使用します。
次に、適切な機械学習アルゴリズムを選択し、モデルを作成します。ここではサポート ベクター マシン (SVM) を例として取り上げます。
model = svm.SVC()
モデルを作成した後、トレーニング セットを使用してモデルをトレーニングできます:
model.fit(X_train, y_train)
トレーニングが完了したら、テスト セットを使用してモデルのパフォーマンスを評価できます。
y_pred = model.predict(X_test)
scikit を使用する - learn によって提供されるメトリクス モジュールは、モデルの精度を計算できます:
accuracy = metrics.accuracy_score(y_test, y_pred) print("Accuracy:", accuracy)
精度に加えて、他の評価指標もモデルのパフォーマンスを評価するために使用できます。 、精度や再現率、F1 スコアなど。
要約すると、機械学習に scikit-learn を使用する手順には、データの準備、データセットの分割、モデルの選択、トレーニング モデル、評価モデルが含まれます。 scikit-learn は、機械学習の効果をさらに向上させるために、データの前処理、特徴の選択、モデルの選択、その他のタスクに使用できる他の多くの関数とクラスも提供します。
要約すると、この記事では機械学習に scikit-learn を使用する方法を紹介し、いくつかのコード例を示します。この記事を通じて読者の皆様が scikit-learn について理解を深め、実践で柔軟に活用できるようになれば幸いです。機械学習に scikit-learn を使用すると、開発効率とモデルのパフォーマンスが大幅に向上し、データ サイエンティストと機械学習エンジニアに強力なツールを提供できます。
以上がscikit-learn を機械学習に使用する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。