python learning_curveFonction
La fonction de cette fonction est de déterminer les scores de formation et de tests de validation croisée pour des ensembles de formation de différentes tailles.
Un générateur de validation croisée divise l'ensemble de données k fois en un ensemble d'entraînement et un ensemble de test. (Apprentissage recommandé : Tutoriel vidéo Python)
Des sous-ensembles de l'ensemble de formation de différentes tailles seront utilisés pour former l'évaluateur et un score sera généré pour chaque taille du sous-ensemble de formation, puis les scores des ensembles de tests sont également calculés. Ensuite, pour chaque sous-ensemble d’entraînement, tous ces scores après k exécutions seront moyennés.
Cette fonction doit référencer le package sklearn
import sklearnfrom sklearn.learning_curve import learning_curve
Le format d'appel de cette fonction est :
learning_curve(estimator, X, y, train_sizes=array([ 0.1 , 0.325, 0.55 , 0.775, 1. ]), cv=None, scoring=None, exploit_incremental_learning=False, n_jobs=1, pre_dispatch='all', verbose=0)
estimateur : Classificateur utilisé
comme, forme (n_samples) ou (n_samples, n_features), facultatif
Classification ou régression cible par rapport à X
train_sizes: type tableau, forme (n_ticks ,), dtype float ou int
Le nombre relatif ou absolu d'échantillons d'entraînement Ces quantités d'échantillons généreront une courbe d'apprentissage. Si dtype est float, il sera considéré comme faisant partie de l'ensemble d'entraînement maximum (ceci est déterminé par la méthode de validation sélectionnée). Sinon, elle sera traitée comme la taille absolue de l’ensemble d’entraînement. Il convient de noter que pour la classification, la taille de l'échantillon doit être suffisamment grande pour contenir au moins un échantillon pour chaque classification.
cv:int, générateur de validation croisée ou un itérable, facultatif
Déterminer la stratégie de séparation de validation croisée
--Aucun, utilisez la stratégie croisée à 3 volets par défaut- validation ,
--entier, détermine le nombre de plis de validation croisée
--un objet utilisé comme générateur de validation croisée
--un objet utilisé pour séparation entraînement/test Itérateur
verbeux : entier, facultatif
Redondance du contrôle : plus elle est élevée, plus il y a d'informations
Valeur de retour :
train_sizes_abs : array, shape = (n_unique_ticks,), dtype int
Le nombre d'échantillons dans l'ensemble d'entraînement utilisé pour générer la courbe d'apprentissage. Étant donné que les entrées en double seront supprimées, les ticks peuvent être inférieurs à n_ticks.
train_scores : tableau, forme (n_ticks, n_cv_folds)
Scores sur l'ensemble d'entraînement
test_scores : tableau , shape (n_ticks, n_cv_folds)
Scores sur l'ensemble de test
Pour plus d'articles techniques liés à Python, veuillez visiter la colonne
Tutoriel Pythonpour apprendre !
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!