Random Forest verwendet mehrere Klassifizierungsbäume, um den Eingabevektor zu klassifizieren. Jeder Baum hat ein Klassifizierungsergebnis, und die Klassifizierung mit der höchsten Stimmenzahl wird schließlich als Endergebnis ausgewählt.
Das Obige ist eine Einführung in Random Forest. Schauen wir uns als Nächstes den Arbeitsablauf des Random Forest-Algorithmus an.
Schritt 1: Wählen Sie zunächst eine Zufallsstichprobe aus dem Datensatz aus.
Schritt 2: Für jede Stichprobe erstellt der Algorithmus einen Entscheidungsbaum. Anschließend werden die Vorhersageergebnisse für jeden Entscheidungsbaum erhalten.
Schritt 3: Über jedes erwartete Ergebnis in diesem Schritt wird abgestimmt.
Schritt 4: Wählen Sie abschließend das Vorhersageergebnis mit den meisten Stimmen als endgültiges Vorhersageergebnis aus.
Prinzip des Random-Forest-Algorithmus
Wenn wir ein zufälliges Waldmodell anhand eines Datensatzes mit bestimmten Merkmalen trainieren, kann uns das resultierende Modellobjekt sagen, welche Merkmale während des Trainingsprozesses am relevantesten sind, dh welche Merkmale den größten Einfluss auf das Ziel haben Variable. Die Bedeutung dieser Variablen wird für jeden Baum in der Zufallsstruktur bestimmt und dann über die gesamte Gesamtstruktur gemittelt, um eine einzelne Kennzahl für jedes Merkmal zu erstellen. Diese Metrik kann verwendet werden, um Features nach Relevanz zu sortieren und unser Random-Forest-Modell nur mithilfe dieser Features neu zu trainieren.
Das obige ist der detaillierte Inhalt vonAnwendung von Random Forest im maschinellen Lernen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!