python learning_curvefunction
이 함수의 기능은 다양한 크기의 훈련 세트에 대한 교차 검증 훈련 및 테스트 점수를 결정하는 것입니다.
교차 검증 생성기는 전체 데이터 세트를 k번 훈련 세트와 테스트 세트로 분할합니다. (권장 학습: Python 비디오 튜토리얼)
다양한 크기의 훈련 세트의 하위 집합이 평가자를 훈련하는 데 사용되며 훈련 하위 집합의 각 크기에 대해 점수가 생성된 다음 테스트 세트의 점수가 생성됩니다. 또한 계산됩니다. 그런 다음 각 훈련 하위 집합에 대해 k 실행 후 모든 점수의 평균이 계산됩니다.
이 함수는 sklearn 패키지를 참조해야 합니다
import sklearnfrom sklearn.learning_curve import learning_curve
이 함수의 호출 형식은 다음과 같습니다:
learning_curve(estimator, X, y, train_sizes=array([ 0.1 , 0.325, 0.55 , 0.775, 1. ]), cv=None, scoring=None, exploit_incremental_learning=False, n_jobs=1, pre_dispatch='all', verbose=0)
estimator: 사용된 분류자
X: 배열 유사, 모양(n_samples, n_features)
훈련 벡터, n_samples는 샘플 수, n_features는 기능 수
y:배열형, 모양 (n_samples) 또는 (n_samples, n_features), 선택사항
대상은 X
train_sizes를 기준으로 분류되거나 회귀됩니다. 유사 배열, 모양(n_ticks,), dtype float 또는 int
훈련 샘플의 상대적 또는 절대 수입니다. 이러한 양의 샘플은 학습 곡선을 생성합니다. dtype이 float인 경우 최대 훈련 세트의 일부로 간주됩니다(이는 선택한 검증 방법에 따라 결정됩니다). 그렇지 않으면 훈련 세트의 절대 크기로 처리됩니다. 분류를 위해서는 표본 크기가 각 분류에 대해 최소한 하나의 표본을 포함할 만큼 충분히 커야 한다는 점에 유의해야 합니다.
cv:int, 교차 검증 생성기 또는 반복 가능, 선택 사항
교차 검증 분리 전략 결정
--없음, 기본 3겹 교차 검증 사용
--정수, 접기 수 결정 교차 검증
--교차 검증 생성기 역할을 하는 개체
-학습/테스트 분할에 적용되는 반복기
verbose: 정수, 선택 사항
Controls verbose: 높을수록 더 많은 정보가 있습니다. is
반환 값:
train_sizes_abs: array, shape = (n_unique_ticks,), dtype int
학습 곡선을 생성하는 데 사용되는 훈련 세트의 샘플 수입니다. 중복된 입력이 제거되므로 틱은 n_ticks보다 작을 수 있습니다.
train_scores : 배열, 모양(n_ticks, n_cv_folds)
훈련 세트의 점수
test_scores : 배열, 모양(n_ticks, n_cv_folds)
점수 테스트 세트
더 많은 Python 관련 기술 기사를 보려면 Python Tutorial 칼럼을 방문하여 알아보세요!
위 내용은 Python에서 learning_curve를 사용하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!