Alih Keluar Lajur Pendua dalam Bingkai Data Pandas
Apabila berurusan dengan bingkai data yang mengandungi lajur pendua, adalah perlu untuk menghapuskan redundansi ini untuk data yang berkesan analisis. Artikel ini menyediakan penyelesaian menyeluruh untuk mengalih keluar lajur pendua dalam Panda, menangani semua aspek isu.
Nama Lajur Pendua
Untuk mengalih keluar lajur berdasarkan nama pendua semata-mata, penyelesaian yang mudah ialah:
<code class="python">df = df.loc[:,~df.columns.duplicated()].copy()</code>
Barisan ini menyemak nama lajur pendua dan hanya mengekalkan nama lajur yang unik.
Nilai Lajur Pendua
Jika matlamatnya adalah untuk mengalih keluar lajur berdasarkan nilai pendua, pendekatan berbeza diperlukan tanpa mengubah bingkai data:
<code class="python">df = df.loc[:,~df.apply(lambda x: x.duplicated(),axis=1).all()].copy()</code>
Kaedah ini menyemak nilai pendua dalam setiap lajur dan menghapuskan lajur yang semua nilai adalah pendua.
Indeks Pendua
Untuk mengalih keluar indeks pendua, ikut pendekatan yang serupa:
<code class="python">df = df.loc[~df.index.duplicated(),:].copy()</code>
Nota Tambahan
Atas ialah kandungan terperinci Bagaimana untuk mengalih keluar Lajur Pendua dalam Bingkai Data Pandas?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!