Comment utiliser le module scikit-learn pour l'apprentissage automatique en Python 3.x
Introduction :
L'apprentissage automatique est une branche de l'intelligence artificielle qui permet aux ordinateurs d'améliorer leurs performances en apprenant et en entraînant des données. Parmi eux, scikit-learn est une puissante bibliothèque d'apprentissage automatique Python qui fournit de nombreux algorithmes et outils d'apprentissage automatique couramment utilisés pour aider les développeurs à créer et déployer rapidement des modèles d'apprentissage automatique. Cet article explique comment utiliser le module scikit-learn dans Python 3.x pour l'apprentissage automatique, avec des exemples de code.
1. Installez le module scikit-learn
Pour utiliser le module scikit-learn, vous devez d'abord l'installer. Vous pouvez utiliser l'outil pip pour terminer l'installation. Entrez simplement la commande suivante dans la ligne de commande :
pip install scikit-learn
2. Importez le module scikit-learn
Une fois l'installation terminée, vous pouvez importer le module scikit-learn. module d'apprentissage dans le script Python afin d'utiliser ses fonctionnalités. Le code importé est le suivant :
importer sklearn
3. Charger l'ensemble de données
Dans l'apprentissage automatique, il est généralement nécessaire de charger d'abord l'ensemble de données, puis de le traiter et de l'analyser. scikit-learn fournit des ensembles de données intégrés qui peuvent être utilisés pour pratiquer et tester des algorithmes. Le code suivant montre comment charger Iris (fleur d'iris), un ensemble de données intégré à scikit-learn :
from sklearn.datasets import load_iris
iris = load_iris()
4.
Sur la machine En apprentissage, le prétraitement des données est une étape importante. Il comprend le nettoyage des données, la sélection des fonctionnalités, la normalisation des données et d'autres opérations pour garantir la qualité et l'exactitude des données. L'extrait de code suivant montre comment normaliser un ensemble de données :
from sklearn.preprocessing import MinMaxScaler
scaler = MinMaxScaler()
normalized_data = scaler fit_transform(iris.data)
. 5. Diviser l'ensemble de données
Dans l'apprentissage automatique, il est généralement nécessaire de diviser l'ensemble de données en un ensemble d'entraînement et un ensemble de test à utiliser lors de l'entraînement du modèle et de l'évaluation des performances du modèle. Le code suivant montre comment diviser l'ensemble de données en ensemble d'entraînement et ensemble de test :
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(normalized_data, iris .target, test_size=0.2)
6. Le modèle de formation
scikit-learn fournit de nombreux algorithmes d'apprentissage automatique et vous pouvez sélectionner l'algorithme approprié pour la formation en fonction des caractéristiques et des objectifs des données. Le code suivant montre un exemple de formation d'un modèle à l'aide de l'algorithme de régression logistique :
from sklearn.linear_model import LogisticRegression
model = LogisticRegression()
model.fit(X_train , y_train)
7. Évaluer les performances du modèle
Une fois la formation terminée, les performances du modèle doivent être évaluées. scikit-learn fournit une variété d'indicateurs d'évaluation qui peuvent nous aider à juger de l'exactitude et de la stabilité du modèle. Le code suivant montre comment utiliser la précision pour évaluer les performances d'un modèle :
from sklearn.metrics import Precision_score
y_pred = model.predict(X_test)
accuracy = precision_score(y_test, y_pred)
8. Réglage du modèle
Sur la base des résultats de l'évaluation, nous pouvons ajuster le modèle pour améliorer les performances du modèle. scikit-learn fournit des fonctions de réglage des paramètres, qui peuvent trouver les meilleurs paramètres du modèle via la recherche par grille et d'autres méthodes. Le code suivant montre comment utiliser la recherche de grille pour ajuster les paramètres du modèle :
from sklearn.model_selection import GridSearchCV
param_grid = {'C': [0.01, 0.1, 1, 10], 'penalty' : [ 'l1', 'l2']}
grid_search = GridSearchCV(estimator=model, param_grid=param_grid, cv=5)
grid_search.fit(X_train, y_train )
best_params = grid_search.best_params_
9 Utilisez le modèle pour la prédiction
Après avoir terminé la formation et le réglage du modèle, vous pouvez utiliser le modèle pour faire des prédictions. Le code suivant montre comment utiliser le modèle entraîné pour faire des prédictions sur de nouvelles données :
best_model = LogisticRegression(**best_params)
best_model .fit(normalized_data, iris.target)
new_data = [[5.1, 3.5, 1.4, 0.2], [6.7, 3.1, 4.4, 1.4], [6.5, 3.0, 5.2, 2.0]]
predictions = best_model.predict(new_data)
Conclusion :
Cet article explique comment utiliser le module scikit-learn dans Python 3.x pour l'apprentissage automatique. En installant des modules, en important des modules, en chargeant des ensembles de données, en prétraitant les données, en fractionnant les ensembles de données, en formant des modèles, en évaluant les performances du modèle, en ajustant le modèle et en utilisant des modèles pour la prédiction, les lecteurs peuvent apprendre à appliquer les modules scikit-learn pour créer et déployer un modèle d'apprentissage automatique. Grâce à la pratique et à l'apprentissage continu, nous pouvons approfondir le domaine de l'apprentissage automatique et obtenir de meilleurs résultats dans des applications pratiques.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!