Mengalih keluar Lajur Pendua dalam Bingkai Data Python
Apabila bekerja dengan bingkai data, lajur pendua selalunya boleh timbul, mewujudkan lebihan dan berpotensi menyebabkan kekeliruan. Ini boleh mengecewakan terutamanya jika anda ingin mengekalkan hanya lajur unik. Nasib baik, terdapat penyelesaian mudah untuk mengalih keluar lajur pendua dalam panda Python.
Penyelesaian untuk Mengalih Keluar Lajur mengikut Nama
Untuk mengalih keluar lajur pendua berdasarkan namanya, gunakan yang berikut baris:
<code class="python">df = df.loc[:,~df.columns.duplicated()].copy()</code>
Pendekatan ini menggunakan operator ~ untuk menyongsangkan nilai boolean yang dikembalikan oleh df.columns.duplicated(), yang menyemak nama lajur pendua. Tatasusunan boolean yang terhasil kemudiannya digunakan untuk memilih hanya lajur tidak pendua dalam pengindeksan df.loc. Kaedah .copy() ditambah untuk mengelakkan kemungkinan ralat dalam mengubah suai bingkai data asal kemudian.
Penyelesaian untuk Mengalih Keluar Pendua mengikut Nilai
Andaikan anda ingin mengalih keluar lajur pendua dengan menyemak nilai mereka, bukan hanya nama mereka. Ini boleh dicapai menggunakan kod berikut:
<code class="python">df = df.loc[:,~df.apply(lambda x: x.duplicated(),axis=1).all()].copy()</code>
Penyelesaian ini mengelakkan pemindahan bingkai data, yang boleh memakan masa untuk bingkai data yang besar. Ia menggunakan fungsi lambda pada setiap lajur untuk menyemak nilai pendua. Tatasusunan boolean yang terhasil kemudiannya digunakan untuk memilih hanya lajur tanpa nilai pendua.
Nota: Berhati-hati apabila menggunakan pendekatan berasaskan nilai. Ia mungkin tidak selalu memberikan hasil yang diingini dalam kes tertentu.
Petua Tambahan
Atas ialah kandungan terperinci Bagaimana untuk Mengeluarkan Lajur Pendua dalam Python DataFrames?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!