Cara Mengeluarkan Lajur Pendua dalam Panda
Apabila bekerja dengan bingkai data dalam Pandas, lajur pendua boleh timbul, yang membawa kepada kekacauan dan kemungkinan ralat . Untuk menyelesaikan isu ini, adalah penting untuk mengetahui cara mengalih keluar lajur pendua dengan berkesan.
Untuk mengalih keluar lajur pendua berdasarkan nama lajur semata-mata, coretan kod berikut boleh digunakan:
<code class="python">df = df.loc[:,~df.columns.duplicated()].copy()</code>
Kaedah ini menyemak setiap nama lajur untuk penduaan dan hanya mengekalkan nama yang unik.
Walau bagaimanapun, jika objektifnya adalah untuk mengalih keluar lajur pendua berdasarkan nilainya, pendekatan yang berbeza diperlukan. Satu kaedah yang cekap melibatkan penggunaan fungsi lambda pada setiap lajur untuk menentukan sama ada ia mengandungi sebarang nilai pendua:
<code class="python">df = df.loc[:,~df.apply(lambda x: x.duplicated(),axis=1).all()].copy()</code>
Teknik ini menyemak setiap nilai lajur untuk penduaan dan mengalih keluar mana-mana lajur yang mengandungi nilai pendua sepenuhnya.
Perhatikan bahawa pendekatan ini mungkin tidak sesuai untuk semua set data, kerana ia mungkin tidak menghasilkan hasil yang diingini dalam kes tertentu. Oleh itu, berhati-hati dinasihatkan semasa melaksanakan kaedah ini.
Atas ialah kandungan terperinci Bagaimana untuk Mengalih keluar Lajur Pendua dalam Panda: Mengikut Nama atau Nilai?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!