Menormalkan Lajur Bingkai Data
Dalam set data, lajur yang berbeza mempunyai julat nilai yang berbeza-beza. Ini boleh menyukarkan untuk membandingkan dan menganalisis data. Menormalkan lajur menskalakannya kepada julat biasa, biasanya antara 0 dan 1, membolehkan perbandingan dan analisis yang lebih mudah.
Satu kaedah untuk menormalkan lajur dalam Pandas, perpustakaan analisis data yang popular, ialah penormalan min. Ia melibatkan penolakan min daripada setiap nilai dan membahagikan hasilnya dengan sisihan piawai. Ini menterjemahkan nilai kepada min 0 dan sisihan piawai 1, seperti yang dilihat dalam formula:
normalized_df = (df - df.mean()) / df.std()
Sebagai alternatif, penormalan min-maks boleh digunakan. Kaedah ini menskalakan nilai berdasarkan nilai minimum dan maksimum dalam lajur. Formula untuk penormalan min-maks ialah:
normalized_df = (df - df.min()) / (df.max() - df.min())
Untuk menggunakan mana-mana kaedah, hanya gunakan formula yang disediakan pada bingkai data. Panda secara automatik menggunakan fungsi mengikut lajur, memastikan penormalan untuk setiap lajur secara bebas.
Atas ialah kandungan terperinci Bagaimana untuk Menormalkan Lajur dalam Bingkai Data untuk Perbandingan dan Analisis?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!