Cet article explique l'utilisation de LazyPredict pour créer des modèles ML simples. La caractéristique de la création de modèles d'apprentissage automatique par LazyPredict est qu'elle ne nécessite pas beaucoup de code et qu'en même temps, elle peut s'adapter à plusieurs modèles sans modifier les paramètres, sélectionnant ainsi le modèle le plus performant parmi de nombreux modèles.
Cet article explique l'utilisation de LazyPredict pour créer des modèles ML simples. La caractéristique de la création de modèles d'apprentissage automatique par LazyPredict est qu'elle ne nécessite pas beaucoup de code et qu'en même temps, elle peut s'adapter à plusieurs modèles sans modifier les paramètres, sélectionnant ainsi le modèle le plus performant parmi de nombreux modèles.
Cet article comprend le contenu suivant :
LazyPredict est connu comme le plus avancé du progiciel Python révolutionne la façon dont les modèles d'apprentissage automatique sont développés. En utilisant LazyPredict, une variété de modèles de base peuvent être créés rapidement avec presque aucun codage, ce qui libère du temps pour choisir le modèle qui correspond le mieux à nos données.
Le principal avantage de LazyPredict est qu'il facilite la sélection du modèle sans nécessiter un réglage approfondi des paramètres du modèle. LazyPredict fournit un moyen rapide et efficace de trouver et d'adapter le meilleur modèle à vos données.
Ensuite, explorons et apprenons-en davantage sur l'utilisation de LazyPredict à travers cet article.
L'installation de la bibliothèque LazyPredict est une tâche très simple. Tout comme l’installation de n’importe quelle autre bibliothèque Python, c’est aussi simple qu’une seule ligne de code.
!pip install lazypredict
Dans cet exemple, nous utiliserons l'ensemble de données sur le cancer du sein du package Sklearn.
Maintenant, chargeons les données.
from sklearn.datasets import load_breast_cancer from lazypredict.Supervised import LazyClassifier data = load_breast_cancer() X = data.data y= data.target
Afin de sélectionner le meilleur modèle de classificateur, déployons maintenant l'algorithme "LazyClassifier". Ces caractéristiques et paramètres d'entrée conviennent à cette classe.
LazyClassifier( verbose=0, ignore_warnings=True, custom_metric=None, predictions=False, random_state=42, classifiers='all', )
Ensuite, appliquez le modèle aux données chargées et ajustez-le.
from lazypredict.Supervised import LazyClassifier from sklearn.model_selection import train_test_split # split the data X_train, X_test, y_train, y_test = train_test_split(X, y,test_size=0.3,random_state =0) # build the lazyclassifier clf = LazyClassifier(verbose=0,ignore_warnings=True, custom_metric=None) # fit it models, predictions = clf.fit(X_train, X_test, y_train, y_test) # print the best models print(models)
Après avoir exécuté le code ci-dessus, nous obtenons les résultats suivants :
Ensuite, nous pouvons faire le travail suivant pour voir les détails du modèle.
model_dictionary = clf.provide_models(X_train,X_test,y_train,y_test)
Ensuite, définissez le nom du modèle pour afficher des informations détaillées sur les étapes.
model_dictionary['LGBMClassifier']
Ici, nous pouvons voir que SimpleImputer est utilisé pour l'ensemble de données, puis StandardScaler est utilisé pour les fonctionnalités numériques. Il n'y a pas de fonctionnalités catégorielles ou ordinales dans cet ensemble de données, mais s'il y en avait, OneHotEncoder et OrdinalEncoder seraient utilisés respectivement. Le modèle LGBMClassifier reçoit les données après transformation et classification.
Le modèle d'apprentissage automatique interne de LazyClassifier utilise la boîte à outils sci-kit-learn pour l'évaluation et l'ajustement. Lorsque la fonction LazyClassifier est appelée, elle construira et ajustera automatiquement divers modèles sur nos données, notamment des arbres de décision, des forêts aléatoires, des machines vectorielles de support, etc. Un ensemble de mesures de performances que vous fournissez, telles que la précision, le rappel ou le score F1, sont utilisés pour évaluer ces modèles. L'ensemble de formation est utilisé pour l'ajustement, tandis que l'ensemble de test est utilisé pour l'évaluation.
Après avoir évalué et ajusté le modèle, LazyClassifier fournira un résumé des résultats de l'évaluation (comme indiqué dans le tableau ci-dessus), ainsi qu'une liste des meilleurs modèles et des mesures de performances pour chaque modèle. Puisqu'il n'est pas nécessaire de régler ou de sélectionner manuellement les modèles, vous pouvez évaluer rapidement et facilement les performances de nombreux modèles et choisir celui qui correspond le mieux à vos données.
Grâce à la fonction "LazyRegressor", le même travail peut être refait pour les modèles de régression. Importons un ensemble de données adapté à la tâche de régression (en utilisant l'ensemble de données de Boston).
Maintenant, utilisons LazyRegressor pour ajuster nos données.
from lazypredict.Supervised import LazyRegressor from sklearn import datasets from sklearn.utils import shuffle import numpy as np # load the data boston = datasets.load_boston() X, y = shuffle(boston.data, boston.target, random_state=0) X = X.astype(np.float32) # split the data X_train, X_test, y_train, y_test = train_test_split(X, y,test_size=0.3,random_state =0) # fit the lazy object reg = LazyRegressor(verbose=0, ignore_warnings=False, custom_metric=None) models, predictions = reg.fit(X_train, X_test, y_train, y_test) # print the results in a table print(models)
Les résultats de l'exécution du code sont les suivants :
以下是对最佳回归模型的详细描述:
model_dictionary = reg.provide_models(X_train,X_test,y_train,y_test) model_dictionary['ExtraTreesRegressor']
这里可以看到SimpleImputer被用于整个数据集,然后是StandardScaler用于数字特征。这个数据集中没有分类或序数特征,但如果有的话,会分别使用OneHotEncoder和OrdinalEncoder。ExtraTreesRegressor模型接收了转换和归类后的数据。
LazyPredict库对于任何从事机器学习行业的人来说都是一种有用的资源。LazyPredict通过自动创建和评估模型的过程来节省选择模型的时间和精力,这大大提高了模型选择过程的有效性。LazyPredict提供了一种快速而简单的方法来比较几个模型的有效性,并确定哪个模型系列最适合我们的数据和问题,因为它能够同时拟合和评估众多模型。
阅读本文之后希望你现在对LazyPredict库有了直观的了解,这些概念将帮助你建立一些真正有价值的项目。
崔皓,51CTO社区编辑,资深架构师,拥有18年的软件开发和架构经验,10年分布式架构经验。
原文标题:LazyPredict: A Utilitarian Python Library to Shortlist the Best ML Models for a Given Use Case,作者:Sanjay Kumar
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!