Cara Mengalih Keluar Lajur Pendua dalam Panda
Jika anda berurusan dengan DataFrame yang mempunyai lajur pendua, anda mungkin mahu mengalih keluarnya untuk ketekalan data atau tujuan analisis. Berikut ialah penyelesaian yang mudah untuk mencapainya:
<code class="python">df = df.loc[:,~df.columns.duplicated()].copy()</code>
Mekanisme:
Nota: Kaedah ini menyemak pendua berdasarkan nama lajur, bukan nilai lajur.
Pendekatan Alternatif:
Mengalih Keluar Duplikat Indeks:
<code class="python">df = df.loc[~df.index.duplicated(),:].copy()</code>
Ini mengalih keluar sebarang baris pendua menggunakan mekanisme yang serupa seperti di atas, tetapi ia menyemak indeks dan bukannya nama lajur.
Mengalih Keluar Pendua mengikut Nilai ( Awas):
<code class="python">df = df.loc[:,~df.apply(lambda x: x.duplicated(),axis=1).all()].copy()</code>
Pendekatan ini mengimbas setiap lajur dan mengalih keluarnya jika semua nilai dalam lajur itu diduplikasi. Walau bagaimanapun, ia harus digunakan dengan berhati-hati kerana ia menyemak nilai, bukan nama lajur dan mungkin tidak menghasilkan hasil yang diingini dalam semua kes.
Atas ialah kandungan terperinci Bagaimana untuk Mengalih keluar Lajur Pendua dalam Panda?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!