Lajur Dinormalisasi: Mengekalkan Nilai dalam Julat
Apabila ia melibatkan analisis data, nilai selalunya berada dalam julat, menjadikan tafsiran sedikit susah. Normalisasi datang untuk menyelamatkannya dengan mengubah nilai menjadi skala yang konsisten antara 0 dan 1.
Mari kita pertimbangkan contoh rangka data:
df: A B C 1000 10 0.5 765 5 0.35 800 7 0.09
Penyelesaian 1: Min Normalisasi
Menggunakan Panda, kita boleh menormalkan lajur dengan mengira sisihan daripada min dan menyeragamkannya dengan sisihan piawai:
normalized_df = (df - df.mean()) / df.std()
Ini memberi kita:
normalized_df: A B C 1.000000 1.000000 1.000000 0.765592 0.500000 0.700000 0.800457 0.700000 0.180000
Penyelesaian 2: Normalisasi Min-Max
Sebagai alternatif, kami boleh melakukan normalisasi min-maks, yang menskalakan nilai berdasarkan minimum dan maksimum data:
normalized_df = (df - df.min()) / (df.max() - df.min())
Terhasil dalam:
normalized_df: A B C 1.000000 1.000000 1.000000 0.765592 0.500000 0.700000 0.800457 0.700000 0.180000
Perhatikan bahawa Pandas secara automatik menggunakan penormalan mengikut lajur, menjadikan proses itu cekap dan mudah.
Atas ialah kandungan terperinci Bagaimana untuk Mengekalkan Nilai Data dalam Julat Menggunakan Normalisasi?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!