Apabila bekerja dengan data jadual, nilai hilang adalah kejadian biasa yang boleh menghalang analisis. Kaedah panda fillna() menyediakan penyelesaian yang mudah dan cekap untuk menggantikan nilai nol ini dengan nilai yang dikehendaki. Walau bagaimanapun, memberikan nilai khusus secara langsung kepada sel yang hilang melalui fillna() boleh menjadi tidak cekap dan memakan masa, terutamanya untuk set data yang besar.
Untuk mengatasi had ini, panda menawarkan ciri berkuasa yang membolehkan anda mengisi nilai yang hilang dengan elemen yang sepadan dari lajur lain. Pendekatan ini menghapuskan keperluan untuk lelaran manual pada setiap baris, meningkatkan prestasi dan kebolehselenggaraan dengan ketara.
Pertimbangkan contoh berikut di mana anda ingin mengisi nilai yang tiada dalam lajur 'Cat1' menggunakan nilai daripada lajur 'Cat2'.
Day | Cat1 | Cat2 |
---|---|---|
1 | cat | mouse |
2 | dog | elephant |
3 | cat | giraf |
4 | NaN | ant |
Day | Cat1 | Cat2 |
---|---|---|
1 | cat | mouse |
2 | dog | elephant |
3 | cat | giraf |
4 | ant | ant |
Dengan kaedah fillna(), anda boleh menyelesaikan tugasan ini dengan mudah:
df['Cat1'].fillna(df['Cat2'])
Kod ini dengan mudah akan menggantikan nilai yang hilang dalam 'Cat1' dengan nilai yang sepadan daripada 'Cat2', mengekalkan struktur data dan menghalang nilai yang salah atau tidak konsisten daripada diperkenalkan. DataFrame yang terhasil akan mempunyai data yang lengkap dan konsisten, sedia untuk analisis atau pemprosesan selanjutnya.
Atas ialah kandungan terperinci Bagaimana untuk mengisi nilai yang hilang dengan cekap dalam satu lajur menggunakan nilai yang sepadan dari lajur lain dalam panda?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!