Pythons Popularität beim maschinellen Lernen (ML) beruht auf seiner Benutzerfreundlichkeit, Flexibilität und umfangreichen Bibliotheksunterstützung. Dieser Leitfaden bietet eine grundlegende Einführung in die Verwendung von Python für ML, deckt wichtige Bibliotheken ab und demonstriert einen einfachen Modellaufbau.
Pythons Dominanz im ML-Bereich ist auf mehrere entscheidende Vorteile zurückzuführen:
Python bietet umfassende Tools für jede Phase des ML-Prozesses, von der Datenanalyse bis zur Modellbereitstellung.
Bevor Sie Ihre ML-Reise beginnen, machen Sie sich mit diesen wichtigen Python-Bibliotheken vertraut:
NumPy: Der Eckpfeiler des numerischen Rechnens in Python. Bietet Unterstützung für Arrays, Matrizen und mathematische Funktionen.
Pandas: Eine leistungsstarke Bibliothek für die Datenbearbeitung und -analyse. Seine DataFrame-Struktur vereinfacht die Arbeit mit strukturierten Daten.
Scikit-learn: Die am häufigsten verwendete ML-Bibliothek in Python. Bietet effiziente Tools für Data Mining und Analyse, einschließlich Algorithmen für Klassifizierung, Regression und Clustering.
Installieren Sie die erforderlichen Bibliotheken mit pip:
pip install numpy pandas scikit-learn
Nach der Installation können Sie mit dem Codieren beginnen.
Lassen Sie uns mithilfe des Iris-Datensatzes ein grundlegendes ML-Modell erstellen, das Irisarten anhand der Blütenblattmessungen klassifiziert.
Schritt 1: Bibliotheken importieren
Importieren Sie die erforderlichen Bibliotheken:
import numpy as np import pandas as pd from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split from sklearn.ensemble import RandomForestClassifier from sklearn.metrics import accuracy_score
Schritt 2: Laden Sie den Datensatz
Laden Sie den Iris-Datensatz mit Scikit-learn:
# Load the Iris dataset iris = load_iris() # Convert to a Pandas DataFrame data = pd.DataFrame(iris.data, columns=iris.feature_names) data['species'] = iris.target
Schritt 3: Datenexploration
Analysieren Sie die Daten:
# Display initial rows print(data.head()) # Check for missing values print(data.isnull().sum()) # Summary statistics print(data.describe())
Schritt 4: Datenvorbereitung
Trennen Sie Funktionen (X) und Beschriftungen (y) und teilen Sie die Daten in Trainings- und Testsätze auf:
# Features (X) and labels (y) X = data.drop('species', axis=1) y = data['species'] # Train-test split X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
Schritt 5: Modellschulung
Trainieren Sie einen Random Forest-Klassifikator:
pip install numpy pandas scikit-learn
Schritt 6: Vorhersage und Bewertung
Machen Sie Vorhersagen und bewerten Sie die Modellgenauigkeit:
import numpy as np import pandas as pd from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split from sklearn.ensemble import RandomForestClassifier from sklearn.metrics import accuracy_score
Herzlichen Glückwunsch! Sie haben Ihr erstes ML-Modell erstellt. Um Ihr Lernen voranzutreiben:
Das obige ist der detaillierte Inhalt vonErste Schritte mit Python für maschinelles Lernen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!