Mengimput Nilai Hilang dengan Min Kumpulan dalam Pandas DataFrames
Dalam tugasan manipulasi data, adalah perkara biasa untuk menemui nilai hilang yang dilambangkan sebagai NaN. Untuk menangani isu ini, satu pendekatan ialah mengisi nilai yang hilang ini dengan nilai min yang dikira dalam kumpulan tertentu.
Pertimbangkan contoh rangka data:
name | value |
---|---|
A | 1 |
A | NaN |
B | NaN |
B | 2 |
B | 3 |
B | 1 |
C | 3 |
C | NaN |
C | 3 |
Matlamat kami adalah untuk menggantikan NaN nilai dengan min kumpulan yang sepadan bagi 'nilai'. Untuk mencapai matlamat ini, kita boleh memanfaatkan kaedah transform():
mean_values = df.groupby('name').transform(lambda x: x.fillna(x.mean())) df["value"] = mean_values
Selepas pelaksanaan, kerangka data dikemas kini:
name | value |
---|---|
A | 1 |
A | 1 |
B | 2 |
B | 2 |
B | 3 |
B | 1 |
C | 3 |
C | 3 |
C | 3 |
Setiap nilai NaN telah digantikan dengan min kumpulan masing-masing , memelihara integriti data untuk analisis lanjut.
Atas ialah kandungan terperinci Bagaimanakah Saya Boleh Mengaitkan Nilai Hilang dalam Pandas DataFrames Menggunakan Cara Kumpulan?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!