La popularité de Python dans le domaine de l'apprentissage automatique (ML) vient de sa facilité d'utilisation, de sa flexibilité et de sa prise en charge étendue de bibliothèques. Ce guide fournit une introduction fondamentale à l'utilisation de Python pour ML, couvrant les bibliothèques essentielles et démontrant une construction de modèle simple.
La domination de Python dans le domaine du ML est due à plusieurs avantages clés :
Python propose des outils complets pour chaque étape du processus ML, de l'analyse des données au déploiement de modèles.
Avant de commencer votre parcours ML, familiarisez-vous avec ces bibliothèques Python cruciales :
NumPy : La pierre angulaire du calcul numérique en Python. Fournit la prise en charge des tableaux, des matrices et des fonctions mathématiques.
Pandas : Une bibliothèque puissante pour la manipulation et l'analyse des données. Sa structure DataFrame simplifie le travail avec des données structurées.
Scikit-learn : La bibliothèque ML la plus utilisée en Python. Offre des outils efficaces pour l'exploration et l'analyse des données, notamment des algorithmes de classification, de régression et de clustering.
Installez les bibliothèques nécessaires à l'aide de pip :
pip install numpy pandas scikit-learn
Une fois installé, vous êtes prêt à commencer à coder.
Créons un modèle ML de base à l'aide de l'ensemble de données Iris, qui classe les espèces d'iris en fonction des mesures des pétales.
Étape 1 : Importer des bibliothèques
Importez les bibliothèques requises :
import numpy as np import pandas as pd from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split from sklearn.ensemble import RandomForestClassifier from sklearn.metrics import accuracy_score
Étape 2 : Charger l'ensemble de données
Chargez l'ensemble de données Iris à l'aide de Scikit-learn :
# Load the Iris dataset iris = load_iris() # Convert to a Pandas DataFrame data = pd.DataFrame(iris.data, columns=iris.feature_names) data['species'] = iris.target
Étape 3 : Exploration des données
Analyser les données :
# Display initial rows print(data.head()) # Check for missing values print(data.isnull().sum()) # Summary statistics print(data.describe())
Étape 4 : Préparation des données
Séparez les fonctionnalités (X) et les étiquettes (y), et divisez les données en ensembles d'entraînement et de test :
# Features (X) and labels (y) X = data.drop('species', axis=1) y = data['species'] # Train-test split X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
Étape 5 : Formation du modèle
Former un classificateur Random Forest :
pip install numpy pandas scikit-learn
Étape 6 : Prédiction et évaluation
Faites des prédictions et évaluez la précision du modèle :
import numpy as np import pandas as pd from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split from sklearn.ensemble import RandomForestClassifier from sklearn.metrics import accuracy_score
Félicitations ! Vous avez créé votre premier modèle ML. Pour approfondir votre apprentissage :
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!