Bagaimana untuk mengalih keluar Baris Terindeks Pendua dalam Panda?-Tutorial Python-php.cn

Bagaimana untuk mengalih keluar Baris Terindeks Pendua dalam Panda?

Barbara Streisand

Lepaskan： 2024-11-22 05:51:16

asal

488 orang telah melayarinya

How to Remove Duplicate Indexed Rows in Pandas?

Mengalih keluar Baris Berindeks Pendua dalam Panda

Dalam panda, nilai indeks pendua boleh timbul dalam pelbagai senario, seperti apabila menambahkan data daripada pelbagai sumber atau membetulkan pemerhatian yang salah. Mengalih keluar baris pendua ini adalah penting untuk ketekalan data dan ketepatan analisis.

Satu pendekatan yang disyorkan ialah menggunakan kaedah ~df3.index.duplicated(keep='first'). Kaedah ini cekap mengenal pasti dan menjatuhkan baris pendua sambil mengekalkan baris unik dalam bingkai data:

df3 = df3[~df3.index.duplicated(keep='first')]

Salin selepas log masuk

Kaedah ini mengatasi teknik lain, seperti drop_duplicates dan groupby, dari segi prestasi, terutamanya untuk bingkai data yang besar. Selain itu, ia lebih mudah dibaca dan mudah difahami.

Untuk bingkai data MultiIndex, kaedah ~df1.index.duplicated(keep='last') boleh digunakan, yang mengekalkan kejadian terakhir bagi setiap nilai indeks unik :

df1[~df1.index.duplicated(keep='last')]

Salin selepas log masuk

Menggunakan pendekatan ini memastikan bahawa kerangka data yang terhasil hanya mengandungi nilai indeks yang unik, menghapuskan lebihan baris yang boleh mengganggu analisis dan pemodelan data.

Atas ialah kandungan terperinci Bagaimana untuk mengalih keluar Baris Terindeks Pendua dalam Panda?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!