La popularité de Python dans le domaine de l'apprentissage automatique (ML) vient de sa facilité d'utilisation, de sa flexibilité et de sa prise en charge étendue de bibliothèques. Ce guide fournit une introduction fondamentale à l'utilisation de Python pour ML, couvrant les bibliothèques essentielles et démontrant une construction de modèle simple.
La domination de Python dans le domaine du ML est due à plusieurs avantages clés :
Python propose des outils complets pour chaque étape du processus ML, de l'analyse des données au déploiement de modèles.
Avant de commencer votre parcours ML, familiarisez-vous avec ces bibliothèques Python cruciales :
NumPy : La pierre angulaire du calcul numérique en Python. Fournit la prise en charge des tableaux, des matrices et des fonctions mathématiques.
Pandas : Une bibliothèque puissante pour la manipulation et l'analyse des données. Sa structure DataFrame simplifie le travail avec des données structurées.
Scikit-learn : La bibliothèque ML la plus utilisée en Python. Offre des outils efficaces pour l'exploration et l'analyse des données, notamment des algorithmes de classification, de régression et de clustering.
Installez les bibliothèques nécessaires à l'aide de pip :
<code class="language-bash">pip install numpy pandas scikit-learn</code>
Une fois installé, vous êtes prêt à commencer à coder.
Créons un modèle ML de base à l'aide de l'ensemble de données Iris, qui classe les espèces d'iris en fonction des mesures des pétales.
Étape 1 : Importer des bibliothèques
Importez les bibliothèques requises :
<code class="language-python">import numpy as np import pandas as pd from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split from sklearn.ensemble import RandomForestClassifier from sklearn.metrics import accuracy_score</code>
Étape 2 : Charger l'ensemble de données
Chargez l'ensemble de données Iris à l'aide de Scikit-learn :
<code class="language-python"># Load the Iris dataset iris = load_iris() # Convert to a Pandas DataFrame data = pd.DataFrame(iris.data, columns=iris.feature_names) data['species'] = iris.target</code>
Étape 3 : Exploration des données
Analyser les données :
<code class="language-python"># Display initial rows print(data.head()) # Check for missing values print(data.isnull().sum()) # Summary statistics print(data.describe())</code>
Étape 4 : Préparation des données
Séparez les fonctionnalités (X) et les étiquettes (y), et divisez les données en ensembles d'entraînement et de test :
<code class="language-python"># Features (X) and labels (y) X = data.drop('species', axis=1) y = data['species'] # Train-test split X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)</code>
Étape 5 : Formation du modèle
Former un classificateur Random Forest :
<code class="language-bash">pip install numpy pandas scikit-learn</code>
Étape 6 : Prédiction et évaluation
Faites des prédictions et évaluez la précision du modèle :
<code class="language-python">import numpy as np import pandas as pd from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split from sklearn.ensemble import RandomForestClassifier from sklearn.metrics import accuracy_score</code>
Félicitations ! Vous avez créé votre premier modèle ML. Pour approfondir votre apprentissage :
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!