Python は広く使用されているプログラミング言語であり、高水準言語であり、習得しやすく、使いやすい言語です。 Python はデータ サイエンティストや機械学習エンジニア向けに多くの実用的なツールやテクニックを提供しますが、その中でも F1 スコアは非常に役立つテクニックです。
F1 スコアは、再現率と適合率を評価する指標です。機械学習タスクでは、多くの場合、分類モデルのパフォーマンスを評価する必要があります。 F1 スコアは、分類子の品質を測定するために使用されます。
一般的に、分類モデルのパフォーマンス評価では、精度、再現率、F1 スコアの 3 つの指標に焦点を当てます。正解率とは、サンプルの総数に対する分類器によって正しく分類されたサンプルの数の割合を指します。再現率とは、陽性クラスとしてマークされたサンプルの総数に対する、分類器が正しく検出できる陽性クラスとしてマークされたサンプル数の割合を指します。 F1 スコアは再現率と適合率の調和平均です。
Python では、sklearn ライブラリの metrics モジュールを使用して F1 スコアを計算できます。このモジュールは、モデル評価に関連する多数の機能を提供します。このうち f1_score() 関数は F1 スコアを計算する関数で、実ラベルと予測ラベルの 2 つの配列を含める必要があります。
以下は、f1_score() 関数を使用して F1 スコアを計算するサンプル コードです。
from sklearn.metrics import f1_score y_true = [0, 1, 0, 1, 0, 1] y_pred = [0, 1, 1, 1, 0, 0] f1 = f1_score(y_true, y_pred) print(f1)
この例では、真のラベルと y_pred を表す 2 つの配列 y_true と y_pred があります。ラベル。次に、 f1_score() 関数を使用して F1 スコアを計算し、最終的に結果を出力します。
f1_score() 関数に加えて、sklearn.metrics は他の多くの関数も提供します。たとえば、classification_report() 関数は分類子のパフォーマンス レポートを生成できます。この関数には、実ラベル、予測ラベル、ラベル カテゴリの 3 つのパラメータが必要です。
次に、classification_report() 関数を使用したサンプル コードを示します。
from sklearn.metrics import classification_report y_true = [0, 1, 0, 1, 0, 1] y_pred = [0, 1, 1, 1, 0, 0] report = classification_report(y_true, y_pred, labels=[0, 1]) print(report)
この例では、classification_report() 関数を使用して分類子のパフォーマンス レポートを生成します。実際のラベル、予測ラベル、ラベル カテゴリの 3 つのパラメータを指定する必要があります。最後に結果を出力します。
さらに、特徴の選択、モデル パラメーターの調整など、F1 スコアのパフォーマンスを向上させるために使用できる他の手法もあります。これらの手法を通じて、モデルの汎化能力を向上させ、それによって F1 スコアのパフォーマンスを向上させることができます。
つまり、F1 スコアは、分類器のパフォーマンスを測定して比較できる非常に便利な手法です。 Python の sklearn ライブラリを利用すると、F1 スコアを迅速かつ簡単に計算し、他のテクニックを使用してモデルのパフォーマンスをさらに最適化できます。
以上がPython での F1 スコアのトリックの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。