fit()
과 fit_transform()
의 차이점이 궁금하신가요? 이 두 기능은 데이터 전처리 중에 자주 나타납니다. 차이점을 자세히 살펴보고 예를 들어 설명해 보겠습니다.
데이터 표준화는 일반적으로 평균, 최소값, 최대값, 분산 등 데이터의 다양한 매개변수를 계산해야 하는 중요한 전처리 단계입니다. fit_transform()
은 이러한 매개변수를 계산하여 데이터 세트에 적용하는 반면, fit()
은 이러한 매개변수만 계산하고 데이터 세트에 적용하지 않습니다.
작은 데이터 배열이 있다고 가정해 보겠습니다.
data = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
각각 fit()
및 transform()
사용:
<code class="language-python">from sklearn.preprocessing import StandardScaler # 步骤 1 scaler = StandardScaler() # 步骤 2 scaler.fit(data) # 此处仅计算均值和标准差,不进行数据缩放 # 步骤 3 scaled_data = scaler.transform(data) # 现在 scaled_data 包含标准化后的数据</code>
사용 fit_transform()
:
<code class="language-python">from sklearn.preprocessing import StandardScaler # 步骤 1 scaler = StandardScaler() # 步骤 2 scaled_data = scaler.fit_transform(data) # scaled_data 包含标准化后的数据</code>
fit_transform()
을 사용하면 추가 단계가 제거되는 것을 볼 수 있습니다.
어떤 기능을 선택할지는 특정 애플리케이션 시나리오에 따라 다릅니다. 먼저 매개변수를 계산한 다음 여러 데이터 세트(예: 훈련 및 테스트 세트)에 변환을 적용해야 하는 경우 각각 fit()
및 transform()
을 사용하는 것이 더 적합합니다. 하지만 단일 데이터 세트에만 변환을 적용해야 하는 경우 fit_transform()
를 사용하면 전처리 프로세스를 더 깔끔하게 만들 수 있습니다.
위 내용은 맞춤 대 Fit_transform의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!