fit()
と fit_transform()
の違いについて疑問に思ったことはありますか?これら 2 つの関数は、データの前処理中によく使用されます。それらの違いを詳しく見て、例を挙げて説明しましょう。
データの標準化は重要な前処理ステップであり、通常、平均、最小、最大、分散などのデータのさまざまなパラメーターを計算する必要があります。 fit_transform()
はこれらのパラメーターを計算してデータセットに適用しますが、fit()
はこれらのパラメーターを計算するだけでデータセットには適用しません。
小さなデータ配列があるとします:
data = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
fit()
と transform()
をそれぞれ使用します:
<code class="language-python">from sklearn.preprocessing import StandardScaler # 步骤 1 scaler = StandardScaler() # 步骤 2 scaler.fit(data) # 此处仅计算均值和标准差,不进行数据缩放 # 步骤 3 scaled_data = scaler.transform(data) # 现在 scaled_data 包含标准化后的数据</code>
fit_transform()
を使用します:
<code class="language-python">from sklearn.preprocessing import StandardScaler # 步骤 1 scaler = StandardScaler() # 步骤 2 scaled_data = scaler.fit_transform(data) # scaled_data 包含标准化后的数据</code>
fit_transform()
を使用すると、余分な手順が省略されることがわかります。
どの関数を選択するかは、特定のアプリケーション シナリオによって異なります。最初にパラメータを計算してから、複数のデータ セット (トレーニング セットやテスト セットなど) に変換を適用する必要がある場合は、それぞれ fit()
と transform()
を使用する方が適切です。ただし、単一のデータセットに変換を適用するだけの場合は、fit_transform()
を使用することで前処理プロセスをよりクリーンにすることができます。
以上がフィットとフィット変換の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。