Maison > développement back-end > Tutoriel Python > Comment utiliser le module scikit-learn pour l'apprentissage automatique dans Python 3.x

Comment utiliser le module scikit-learn pour l'apprentissage automatique dans Python 3.x

WBOY
Libérer: 2023-07-30 09:37:49
original
2242 Les gens l'ont consulté

Comment utiliser le module scikit-learn pour l'apprentissage automatique en Python 3.x

Introduction :
L'apprentissage automatique est une branche de l'intelligence artificielle qui permet aux ordinateurs d'améliorer leurs performances en apprenant et en entraînant des données. Parmi eux, scikit-learn est une puissante bibliothèque d'apprentissage automatique Python qui fournit de nombreux algorithmes et outils d'apprentissage automatique couramment utilisés pour aider les développeurs à créer et déployer rapidement des modèles d'apprentissage automatique. Cet article explique comment utiliser le module scikit-learn dans Python 3.x pour l'apprentissage automatique, avec des exemples de code.

1. Installez le module scikit-learn
Pour utiliser le module scikit-learn, vous devez d'abord l'installer. Vous pouvez utiliser l'outil pip pour terminer l'installation. Entrez simplement la commande suivante dans la ligne de commande :
pip install scikit-learn

2. Importez le module scikit-learn
Une fois l'installation terminée, vous pouvez importer le module scikit-learn. module d'apprentissage dans le script Python afin d'utiliser ses fonctionnalités. Le code importé est le suivant :
importer sklearn

3. Charger l'ensemble de données
Dans l'apprentissage automatique, il est généralement nécessaire de charger d'abord l'ensemble de données, puis de le traiter et de l'analyser. scikit-learn fournit des ensembles de données intégrés qui peuvent être utilisés pour pratiquer et tester des algorithmes. Le code suivant montre comment charger Iris (fleur d'iris), un ensemble de données intégré à scikit-learn :
from sklearn.datasets import load_iris

Chargez l'ensemble de données de fleur d'iris

iris = load_iris()

4.
Sur la machine En apprentissage, le prétraitement des données est une étape importante. Il comprend le nettoyage des données, la sélection des fonctionnalités, la normalisation des données et d'autres opérations pour garantir la qualité et l'exactitude des données. L'extrait de code suivant montre comment normaliser un ensemble de données :
from sklearn.preprocessing import MinMaxScaler

Créez un objet MinMaxScaler

scaler = MinMaxScaler()

Normalisez un ensemble de données

normalized_data = scaler fit_transform(iris.data)

. 5. Diviser l'ensemble de données
Dans l'apprentissage automatique, il est généralement nécessaire de diviser l'ensemble de données en un ensemble d'entraînement et un ensemble de test à utiliser lors de l'entraînement du modèle et de l'évaluation des performances du modèle. Le code suivant montre comment diviser l'ensemble de données en ensemble d'entraînement et ensemble de test :
from sklearn.model_selection import train_test_split

Diviser l'ensemble de données en ensemble d'entraînement et ensemble de test

X_train, X_test, y_train, y_test = train_test_split(normalized_data, iris .target, test_size=0.2)

6. Le modèle de formation
scikit-learn fournit de nombreux algorithmes d'apprentissage automatique et vous pouvez sélectionner l'algorithme approprié pour la formation en fonction des caractéristiques et des objectifs des données. Le code suivant montre un exemple de formation d'un modèle à l'aide de l'algorithme de régression logistique :
from sklearn.linear_model import LogisticRegression

Créez un objet de modèle de régression logistique

model = LogisticRegression()

Utilisez l'ensemble d'entraînement pour entraîner le modèle

model.fit(X_train , y_train)

7. Évaluer les performances du modèle
Une fois la formation terminée, les performances du modèle doivent être évaluées. scikit-learn fournit une variété d'indicateurs d'évaluation qui peuvent nous aider à juger de l'exactitude et de la stabilité du modèle. Le code suivant montre comment utiliser la précision pour évaluer les performances d'un modèle :
from sklearn.metrics import Precision_score

Utilisez l'ensemble de tests pour faire des prédictions

y_pred = model.predict(X_test)

Calculez la précision

accuracy = precision_score(y_test, y_pred)

8. Réglage du modèle
Sur la base des résultats de l'évaluation, nous pouvons ajuster le modèle pour améliorer les performances du modèle. scikit-learn fournit des fonctions de réglage des paramètres, qui peuvent trouver les meilleurs paramètres du modèle via la recherche par grille et d'autres méthodes. Le code suivant montre comment utiliser la recherche de grille pour ajuster les paramètres du modèle :
from sklearn.model_selection import GridSearchCV

Define Parameter Grid

param_grid = {'C': [0.01, 0.1, 1, 10], 'penalty' : [ 'l1', 'l2']}

Créer un objet GridSearchCV

grid_search = GridSearchCV(estimator=model, param_grid=param_grid, cv=5)

Utilisez l'ensemble d'entraînement pour la recherche de grille

grid_search.fit(X_train, y_train )

Obtenez les meilleurs paramètres du modèle

best_params = grid_search.best_params_

9 Utilisez le modèle pour la prédiction
Après avoir terminé la formation et le réglage du modèle, vous pouvez utiliser le modèle pour faire des prédictions. Le code suivant montre comment utiliser le modèle entraîné pour faire des prédictions sur de nouvelles données :

Créez un nouvel objet modèle en utilisant les meilleurs paramètres du modèle

best_model = LogisticRegression(**best_params)

Utilisez l'intégralité de l'ensemble de données pour la formation du modèle

best_model .fit(normalized_data, iris.target)

Préparer de nouvelles données

new_data = [[5.1, 3.5, 1.4, 0.2], [6.7, 3.1, 4.4, 1.4], [6.5, 3.0, 5.2, 2.0]]

Faites des prédictions sur de nouvelles données

predictions = best_model.predict(new_data)

Conclusion :
Cet article explique comment utiliser le module scikit-learn dans Python 3.x pour l'apprentissage automatique. En installant des modules, en important des modules, en chargeant des ensembles de données, en prétraitant les données, en fractionnant les ensembles de données, en formant des modèles, en évaluant les performances du modèle, en ajustant le modèle et en utilisant des modèles pour la prédiction, les lecteurs peuvent apprendre à appliquer les modules scikit-learn pour créer et déployer un modèle d'apprentissage automatique. Grâce à la pratique et à l'apprentissage continu, nous pouvons approfondir le domaine de l'apprentissage automatique et obtenir de meilleurs résultats dans des applications pratiques.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Étiquettes associées:
source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal