> 기술 주변기기 > 일체 포함 > Scikit-Learn을 사용하여 기계 학습 예측 방법을 빠르게 익히십시오.

Scikit-Learn을 사용하여 기계 학습 예측 방법을 빠르게 익히십시오.

王林
풀어 주다: 2023-05-27 14:26:03
앞으로
1466명이 탐색했습니다.

이 글에서는 예측 함수의 차이점과 그 용도에 대해 설명합니다.

기계 학습에서는 예측 및 예측_proba, 예측_log_proba 및 결정_함수 방법을 사용하여 훈련된 모델을 기반으로 예측을 수행합니다.

predict method

예측 방법을 사용하여 이진 분류 또는 다변량 분류 예측을 수행하고 예측 레이블을 출력합니다. 예를 들어 고객이 제품을 구매할지 여부를 예측하기 위해 로지스틱 회귀 모델을 학습한 경우 예측 방법을 사용하여 신규 고객이 제품을 구매할지 여부를 예측할 수 있습니다.

우리는 scikit-learn의 유방암 데이터세트를 사용할 것입니다. 이 데이터 세트에는 종양 관찰 내용과 종양이 악성인지 양성인지에 대한 해당 레이블이 포함되어 있습니다.

import numpy as npfrom sklearn.svm import SVCfrom sklearn.preprocessing import StandardScalerfrom sklearn.pipeline import make_pipelineimport matplotlib.pyplot as pltfrom sklearn.datasets import load_breast_cancer# 加载数据集dataset = load_breast_cancer(as_frame=True)# 创建特征和目标X = dataset['data']y = dataset['target']# 将数据集分割成训练集和测试集from sklearn.model_selection import train_test_splitX_train, X_test, y_train, y_test = train_test_split(X, y , test_size=0.25, random_state=0)# 我们创建一个简单的管道来规范数据并使用`SVC`分类器训练模型svc_clf = make_pipeline(StandardScaler(),SVC(max_iter=1000, probability=True))svc_clf.fit(X_train, y_train)
로그인 후 복사
# 我们正在预测X_test的第一个条目print(svc_clf.predict(X_test[:1]))
로그인 후 복사
# 预测X_test的第一个条目属于哪一类[0]
로그인 후 복사

predict_proba 방법

predict_proba 함수를 사용하여 각 카테고리에 대한 확률 예측을 수행하고 각 카테고리 레이블의 가능한 확률 추정치를 반환합니다. 이항 또는 다변량 분류 문제에서 이 접근 방식은 일반적으로 가능한 각 결과의 확률을 결정하는 데 사용됩니다. 예를 들어, 동물 이미지를 고양이, 개, 말로 분류하도록 모델을 훈련한 경우 예측_proba 방법을 사용하여 각 범주 레이블에 대한 확률 추정치를 얻을 수 있습니다.

print(svc_clf.predict_proba(X_test[:1]))
로그인 후 복사
[[0.99848307 0.00151693]]
로그인 후 복사

predict_log_proba 방법

예측_log_proba 방법은 예측_proba와 유사하지만 원시 확률 대신 확률 추정의 로그를 반환합니다. 이는 수치적 언더플로 또는 오버플로 문제를 피할 수 있기 때문에 매우 작거나 매우 큰 확률 값을 처리하는 데 매우 유용합니다.

print(svc_clf.predict_log_proba(X_test[:1]))
로그인 후 복사
rrree

decision_function 방법

선형 이진 분류 모델은 Decision_function 방법을 활용할 수 있습니다. 이는 해당 클래스 레이블을 추론하는 데 사용할 수 있는 각 입력 데이터 포인트에 대한 점수를 생성합니다. 데이터 포인트를 긍정적 또는 부정적으로 분류하는 임계값은 애플리케이션 또는 도메인 지식을 기반으로 설정할 수 있습니다.

[[-1.51808474e-03 -6.49106473e+00]]
로그인 후 복사
print(svc_clf.decision_function(X_test[:1]))
로그인 후 복사

요약

  • 입력 데이터의 예측 클래스 레이블을 얻으려면 이진 또는 다변량 분류 문제에 예측을 사용하세요.
  • 가능한 각 클래스 레이블에 대한 확률 추정치를 얻으려는 경우 이진 또는 다변량 분류 문제에 예측_proba를 사용하세요.
  • 매우 작거나 매우 큰 확률 값을 처리해야 하거나 수치 언더플로 또는 오버플로 문제를 피하려는 경우 예측_로그_프로바를 사용하세요.
  • 각 입력 데이터 포인트에 대한 점수를 얻으려면 선형 모델의 이진 분류 문제에 Decision_function을 사용하세요.

참고: 일부 분류기의 예측 방법은 불완전하거나 함수에 액세스하려면 추가 매개변수가 필요할 수 있습니다. 예: SVC는 확률 예측을 사용하려면 확률 매개변수를 True로 설정해야 합니다.

위 내용은 Scikit-Learn을 사용하여 기계 학습 예측 방법을 빠르게 익히십시오.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

관련 라벨:
원천:51cto.com
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿