fit()
dan fit_transform()
? Kedua-dua fungsi ini sering muncul semasa prapemprosesan data. Mari kita lihat dengan lebih dekat perbezaan mereka dan gambarkan mereka dengan contoh.
Penyawaian data ialah langkah prapemprosesan penting yang biasanya memerlukan pengiraan pelbagai parameter data, seperti min, minimum, maksimum dan varians. fit_transform()
akan mengira parameter ini dan menggunakannya pada set data, manakala fit()
hanya akan mengira parameter ini dan tidak menggunakannya pada set data.
Andaikan kita mempunyai tatasusunan data yang kecil:
data = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
Gunakan fit()
dan transform()
masing-masing:
<code class="language-python">from sklearn.preprocessing import StandardScaler # 步骤 1 scaler = StandardScaler() # 步骤 2 scaler.fit(data) # 此处仅计算均值和标准差,不进行数据缩放 # 步骤 3 scaled_data = scaler.transform(data) # 现在 scaled_data 包含标准化后的数据</code>
Gunakan fit_transform()
:
<code class="language-python">from sklearn.preprocessing import StandardScaler # 步骤 1 scaler = StandardScaler() # 步骤 2 scaled_data = scaler.fit_transform(data) # scaled_data 包含标准化后的数据</code>
Kita dapat melihat bahawa menggunakan fit_transform()
menghapuskan langkah tambahan.
Fungsi yang manakah untuk dipilih bergantung pada senario aplikasi khusus anda. Jika anda perlu mengira parameter dahulu dan kemudian menggunakan transformasi pada berbilang set data (seperti set latihan dan ujian), adalah lebih sesuai untuk menggunakan fit()
dan transform()
masing-masing. Tetapi jika anda hanya perlu menggunakan transformasi pada set data tunggal, fit_transform()
boleh menjadikan proses prapemprosesan lebih bersih.
Atas ialah kandungan terperinci Fit vs Fit_transform. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!