あらゆる種類の予測を行う際に信頼性が高く、正確で効率的なモデルを考案するには、機械学習とデータ サイエンスでモデルのパフォーマンスを評価する必要があります。このための一般的なツールには、混同行列と ROC 曲線があります。どちらも異なる目的を持っており、いつ使用するかを正確に知ることは、堅牢なモデル評価において重要です。このブログでは、両方のツールの詳細を説明し、比較し、最後にモデルの評価でどちらを使用するかについてのガイダンスを提供します。
あらゆる種類の予測を行う際に信頼性が高く、正確で、効率的なモデルを考案するには、機械学習とデータ サイエンスでモデルのパフォーマンスを評価する必要があります。このための一般的なツールには、混同行列と ROC 曲線があります。どちらも異なる目的を持っており、いつ使用するかを正確に知ることは、堅牢なモデル評価において重要です。このブログでは、両方のツールの詳細を説明し、比較し、最後にモデルの評価でどちらを使用するかについてのガイダンスを提供します。
混同行列は表です。分類モデルのパフォーマンスを視覚化するために使用されます。一般に、モデルの予測を 4 つのクラスに分割します。
真陽性 (TP): モデルは陽性クラスを正しく予測します。
真陰性 (TN): モデルは陰性クラスを正しく予測します。
偽陽性 (FP): モデルは陽性クラスを誤って予測します。
偽陰性 (FN): モデルは誤って陰性クラスを予測しました。タイプ II エラー。
バイナリ分類の場合、これらは 2x2 行列で設定できます。マルチクラス分類の場合、それらはより大きな行列に拡張されます。
精度: (TP TN) / (TP TN FP FN)
精度: TP / (TP FP)
リコール (感度): TP / (TP FN)
F1 スコア: 2 (精度 * Recall) / (Precision Recall)
特に分類の結果について詳細な洞察が必要な場合は、混同行列を使用します。これにより、クラスでのパフォーマンスの詳細な分析が得られます。より具体的には、モデルの弱点 (たとえば、高い誤検知など) が得られます。
クラス不均衡データセット:精度、再現率、および F1 スコアは、混同マトリックスから導出できる指標の一部です。これらのメトリクスは、クラスの不均衡に対処する状況で役立ちます。これらは、精度と比較したモデルのパフォーマンスを真に示しています。
バイナリおよびマルチクラス分類問題: 混同行列は、バイナリ分類の問題で日常的に使用されています。それでも、複数のクラスでトレーニングされたモデルを推定するために簡単に一般化でき、多用途のツールになります。
受信者動作特性 (ROC) 曲線図は、識別しきい値を変化させたときのバイナリ分類器システムのパフォーマンスを示すグラフです。 ROC 曲線は、さまざまなしきい値設定で真陽性率と偽陽性率をプロットして作成する必要があります。
真陽性率、リコール: TP / (TP FN)
偽陽性率 (FPR): FP / (FP TN)
ROC 曲線の下の面積 (AUC-ROC) は、多くの場合、概要の尺度として機能します。モデルが正のクラスと負のクラスをどの程度区別できるか。 AUC 1 は完全なモデルに対応します。 AUC 0.5 は、識別力のないモデルに対応します。
ROC 曲線は、次のシナリオで特に役立ちます。
バイナリ分類子評価 ROC 曲線はバイナリ分類タスクに固有であるため、マルチクラス問題には直接適用できません。
複数のモデルの比較 AUC-ROC により、異なるモデルの比較が可能になります。決定しきい値の選択に関して、単一のスカラー値によってモデル化します。
ROC 曲線は、感度を知りたい場合に役立ちます。 - 異なる閾値での特異性のトレードオフ。
混同行列: モデルのパフォーマンスをクラスごとに分類したもので、特定のクラスに関するモデルの問題を診断するのに非常に役立ちます。
ROC 曲線: AUC によって要約された、考えられるすべてのしきい値にわたるモデルの識別能力の全体像を示します。
混同行列: とりわけ、混同行列からの適合率や再現率などの指標は、クラスの不均衡のコンテキストでより分かりやすくなります。
ROC 曲線: 非常に不均衡なデータセットの場合、ROC 曲線はクラス分布を直接考慮していないため、情報が少なくなる可能性があります。
混同行列: バイナリ分類だけでなくマルチクラス分類も機能します。
ROC 曲線: 主にバイナリ分類に使用されますが、マルチクラス分類にも拡張されています。クラスの問題が用意されています
混同行列: メトリックは固定しきい値で計算されます。
ROC 曲線: 考えられるすべてのしきい値のパフォーマンスが視覚化されます。
混同行列と ROC 曲線のどちらを使用する必要があるかは、すべてケースと特定のニーズによって異なります。
混同マトリックスと ROC 曲線のどちらを選択するかは、特定のニーズと問題の状況に基づいて決定されます。
クラスごとにモデルのパフォーマンスを詳細に知りたい場合。
あなたはクラス不均衡なデータを扱っており、精度指標以上のものを必要としています。
あなたは、マルチクラス分類のためのモデル評価に取り組んでいます。
さまざまなしきい値で異なるバイナリ分類器のパフォーマンスを比較したい場合。
あなたは、クラスを区別するモデルの一般的な能力に興味があります。
モデルを比較するために、1 つの概要指標 (AUC) だけを使用したいと考えています。 .
混同行列と ROC 曲線はどちらも、データ サイエンティストにとって非常に役立つ追加のテクニックです。 2 つのツールは、モデルのパフォーマンスについて異なる洞察を提供します。たとえば、混同マトリックスは、特に不均衡なデータセットの場合、モデルがどのように動作しているかを正確に理解するために重要な、クラス固有の詳細なメトリクスを提供することに優れています。対照的に、ROC 曲線は、すべてのしきい値にわたるバイナリ分類器の全体的な識別力を非常にうまく捉えています。それぞれの手法特有の長所と短所をマスターすると、より正確で、より信頼性が高く、より効果的な機械学習モデルを構築する際に、特定のモデル評価ニーズに合わせて適切なツールを適用できるようになります。
以上が混同行列と ROC 曲線: モデルの評価にどちらを使用するかの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。