隨機森林利用多個分類樹對輸入向量進行分類,每棵樹都有一個分類結果,最終選擇票數最高的分類作為最終結果。
以上是隨機森林的介紹,接下來我們來看看隨機森林演算法的工作流程。
第1步:先從資料集中選擇隨機樣本。
第2步:對於每個樣本,演算法將建立一個決策樹。然後將獲得每個決策樹的預測結果。
第3步:將對這一步中的每個預期結果進行投票。
第4步:最後選擇得票最多的預測結果作為最終的預測結果。
隨機森林演算法原理
當我們在具有特定特徵的資料集上訓練隨機森林模型時,所得到的模型物件可以告訴我們哪些特徵在訓練過程中最相關,也就是哪些特徵對目標變數的影響最大。此變數的重要性是針對隨機森林中每棵樹確定的,然後在整個森林中取平均值以產生每個特徵的單一測量值。可以使用此測量值按相關性對特徵進行排序,並僅使用這些特徵重新訓練我們的隨機森林模型。
以上是隨機森林在機器學習的應用的詳細內容。更多資訊請關注PHP中文網其他相關文章!