Was sind die sechs Schritte des Data Mining?
Data Mining ist der nicht triviale Prozess, um aus großen Datenmengen effektive, neuartige, potenziell nützliche und letztlich verständliche Muster zu gewinnen. Die Schritte sind:
1. Definieren Sie das Problem
4. Generieren Sie das Modell;
5. Stellen Sie das Modell bereit und aktualisieren Sie es.
Data Mining erfordert normalerweise Datenerfassung, Datenintegration, Datenspezifikation, Datenbereinigung, Datentransformation, Data Mining-Implementierungsprozess, Musterbewertung und Wissensdarstellung
2. Datenintegration: Klassifizieren Sie Daten aus verschiedenen Quellen und Formaten
4. Datenbereinigung: Einige Daten sind unvollständig, z. B.: Einige haben fehlende Werte (Werte existieren nicht), einige enthalten Rauschen (Fehler, isolierte Punkte) und einige sind inkonsistent (z als verschiedene Einheiten usw.), können wir Tools verwenden, um die Daten zu bereinigen und vollständige, korrekte und konsistente Daten zu erhalten.
6. Merkmalsextraktion oder Merkmalsauswahl: Die Merkmalsextraktion wird hauptsächlich in der Computer Vision und Bildverarbeitung verwendet, um irrelevante und redundante Merkmale vorzuschlagen, um eine Überanpassung zu verhindern und die Modellgenauigkeit zu verbessern und so weiter.
7. Data-Mining-Prozess: Analysieren Sie die Dateninformationen im Data Warehouse, wählen Sie geeignete Data-Mining-Tools aus, wenden Sie statistische Methoden an und verwenden Sie entsprechende Data-Mining-Algorithmen. .
8. Überprüfen Sie aus geschäftlicher Sicht die Richtigkeit der Ergebnisse der Datenanalyse und des Data Mining.
9. Wissensdarstellung, die den Benutzern die Ergebnisse des Data Mining visuell präsentiert.
Empfohlenes Tutorial: „
PHP“
Das obige ist der detaillierte Inhalt vonWas sind die sechs Schritte des Data Mining?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!