Comment utiliser learning_curve en python-Tutoriel Python-php.cn

Comment utiliser learning_curve en python

(*-*)浩

Libérer： 2019-07-09 10:24:53

original

3416 Les gens l'ont consulté

python learning_curveFonction

La fonction de cette fonction est de déterminer les scores de formation et de tests de validation croisée pour des ensembles de formation de différentes tailles.

Comment utiliser learning_curve en python

Un générateur de validation croisée divise l'ensemble de données k fois en un ensemble d'entraînement et un ensemble de test. (Apprentissage recommandé : Tutoriel vidéo Python)

Des sous-ensembles de l'ensemble de formation de différentes tailles seront utilisés pour former l'évaluateur et un score sera généré pour chaque taille du sous-ensemble de formation, puis les scores des ensembles de tests sont également calculés. Ensuite, pour chaque sous-ensemble d’entraînement, tous ces scores après k exécutions seront moyennés.

Cette fonction doit référencer le package sklearn

import sklearnfrom sklearn.learning_curve import learning_curve

Copier après la connexion

Le format d'appel de cette fonction est :

learning_curve(estimator, X, y, train_sizes=array([ 0.1  ,  0.325,  0.55 ,  0.775,  1.   ]), cv=None, scoring=None, exploit_incremental_learning=False, n_jobs=1, pre_dispatch='all', verbose=0)

Copier après la connexion

estimateur : Classificateur utilisé

comme, forme (n_samples) ou (n_samples, n_features), facultatif

Classification ou régression cible par rapport à X

train_sizes: type tableau, forme (n_ticks ,), dtype float ou int

Le nombre relatif ou absolu d'échantillons d'entraînement Ces quantités d'échantillons généreront une courbe d'apprentissage. Si dtype est float, il sera considéré comme faisant partie de l'ensemble d'entraînement maximum (ceci est déterminé par la méthode de validation sélectionnée). Sinon, elle sera traitée comme la taille absolue de l’ensemble d’entraînement. Il convient de noter que pour la classification, la taille de l'échantillon doit être suffisamment grande pour contenir au moins un échantillon pour chaque classification.

cv:int, générateur de validation croisée ou un itérable, facultatif

Déterminer la stratégie de séparation de validation croisée

--Aucun, utilisez la stratégie croisée à 3 volets par défaut- validation ,

--entier, détermine le nombre de plis de validation croisée

--un objet utilisé comme générateur de validation croisée

--un objet utilisé pour séparation entraînement/test Itérateur

verbeux : entier, facultatif

Redondance du contrôle : plus elle est élevée, plus il y a d'informations

Valeur de retour :

train_sizes_abs : array, shape = (n_unique_ticks,), dtype int

Le nombre d'échantillons dans l'ensemble d'entraînement utilisé pour générer la courbe d'apprentissage. Étant donné que les entrées en double seront supprimées, les ticks peuvent être inférieurs à n_ticks.

train_scores : tableau, forme (n_ticks, n_cv_folds)

Scores sur l'ensemble d'entraînement

test_scores : tableau , shape (n_ticks, n_cv_folds)

Scores sur l'ensemble de test

Pour plus d'articles techniques liés à Python, veuillez visiter la colonne

Tutoriel Python

pour apprendre !

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!