랜덤 포레스트는 다중 분류 트리를 사용하여 입력 벡터를 분류합니다. 각 트리에는 분류 결과가 있으며, 가장 많은 표를 얻은 분류가 최종 결과로 선택됩니다.
위는 Random Forest에 대한 소개입니다. 다음으로 Random Forest 알고리즘의 작업 흐름을 살펴보겠습니다.
1단계: 먼저 데이터 세트에서 무작위 샘플을 선택합니다.
2단계: 각 샘플에 대해 알고리즘은 결정 트리를 생성합니다. 그러면 각 의사결정 트리의 예측 결과가 얻어집니다.
3단계: 이 단계에서 예상되는 각 결과가 투표됩니다.
4단계: 마지막으로 가장 많은 표를 얻은 예측 결과를 최종 예측 결과로 선택합니다.
랜덤 포레스트 알고리즘의 원리
특정 특성을 가진 데이터 세트에 대해 랜덤 포레스트 모델을 훈련할 때 결과 모델 객체는 훈련 과정에서 가장 관련성이 높은 특성, 즉 대상에 가장 큰 영향을 미치는 특성을 알려줄 수 있습니다. 변하기 쉬운. 이 변수의 중요성은 랜덤 포레스트의 각 트리에 대해 결정된 다음 포리스트 전체에서 평균을 구하여 각 기능에 대한 단일 측정값을 생성합니다. 이 측정항목은 관련성에 따라 기능을 정렬하고 이러한 기능만 사용하여 랜덤 포레스트 모델을 재교육하는 데 사용할 수 있습니다.
위 내용은 기계 학습에 Random Forest 적용의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!