ランダム フォレストでは、複数の分類ツリーを使用して入力ベクトルを分類します。各ツリーには分類結果があり、最終的に投票数が最も多い分類が最終結果として選択されます。
上記はランダム フォレストの概要であり、次にランダム フォレスト アルゴリズムのワークフローを見てみましょう。
ステップ 1: まず、データセットからランダムなサンプルを選択します。
ステップ 2: サンプルごとに、アルゴリズムによってデシジョン ツリーが作成されます。すると、各決定木の予測結果が得られます。
ステップ 3: このステップで予想される各結果について投票が行われます。
ステップ 4: 最後に、最も多くの票を獲得した予測結果を最終予測結果として選択します。
ランダム フォレスト アルゴリズムの原理
特定の特性を持つデータ セットでランダム フォレスト モデルをトレーニングすると、結果として得られるモデル オブジェクトによって、トレーニング プロセス中にどの特徴が最も関連しているかを知ることができます。どの特徴がターゲット変数に最も大きな影響を与えるか。この変数の重要性は、ランダム フォレスト内のツリーごとに決定され、フォレスト全体で平均されて、各特徴の単一の測定値が生成されます。このメトリックは、関連性によって特徴を並べ替え、これらの特徴のみを使用してランダム フォレスト モデルを再トレーニングするために使用できます。
以上が機械学習におけるランダム フォレストの応用の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。