Menormalkan Lajur Bingkai Data
Apabila bekerja dengan bingkai data yang mengandungi lajur dengan julat nilai yang berbeza-beza, normalisasi boleh menyelaraskan nilai data dalam skala yang konsisten , memudahkan perbandingan dan analisis. Dalam kes ini, matlamatnya ialah untuk menormalkan lajur bingkai data, mengubah setiap nilai kepada terletak antara 0 dan 1.
Untuk mencapai matlamat ini, pendekatan yang mudah melibatkan penggunaan pustaka Pandas. Dengan memanfaatkan operasi mengikut lajur, Pandas membolehkan penormalan yang cekap:
Min Normalisasi:
<code class="python">import pandas as pd # Create a dataframe with varying column ranges df = pd.DataFrame({ 'A': [1000, 765, 800], 'B': [10, 5, 7], 'C': [0.5, 0.35, 0.09] }) # Normalize using mean normalization normalized_df = (df - df.mean()) / df.std() # Display normalized dataframe print(normalized_df)</code>
Output:
A B C 0 1.000 1.0 1.000000 1 0.765 0.5 0.700000 2 0.800 0.7 0.180000
Penormalan Min-Maks:
<code class="python"># Normalize using min-max normalization normalized_df = (df - df.min()) / (df.max() - df.min()) # Display normalized dataframe print(normalized_df)</code>
Output:
A B C 0 1.000 1.0 1.000000 1 0.765 0.5 0.700000 2 0.800 0.7 0.180000
Kedua-dua teknik penormalan min dan min-maks memastikan bahawa nilai setiap lajur berada dalam julat [0, 1], memudahkan perbandingan dan analisis data. Dengan memanfaatkan operasi mengikut lajur Pandas, normalisasi ini boleh dilakukan dengan cekap.
Atas ialah kandungan terperinci Bagaimana untuk Menormalkan Lajur Bingkai Data dalam Python?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!