Mencari Nilai Berbeza dalam Lajur Bingkai Data
Apabila bekerja dengan bingkai data, selalunya perlu untuk mendapatkan semula baris berdasarkan nilai yang berbeza dalam lajur tertentu. Ini membolehkan kami menghapuskan nilai pendua dan mendapatkan set titik data yang unik.
Pertimbangkan rangka data berikut:
COL1 COL2 a.com 22 b.com 45 c.com 34 e.com 45 f.com 56 g.com 22 h.com 45
Andaikan kami ingin mengekstrak baris yang sepadan dengan nilai unik dalam lajur COL2. Untuk mencapai matlamat ini, kita boleh menggunakan fungsi drop_duplicates panda. Fungsi ini mengambil nama lajur sebagai argumen dan mengalih keluar baris pendua daripada bingkai data.
<code class="python">import pandas as pd df = pd.DataFrame(...) # assuming the given dataframe df = df.drop_duplicates('COL2')</code>
Secara lalai, drop_duplicates mengekalkan kejadian pertama bagi setiap nilai unik. Sebagai alternatif, kita boleh menentukan keep='last' untuk mengekalkan kejadian terakhir atau keep=False untuk mengalih keluar semua baris pendua:
<code class="python"># Keep first occurrence df = df.drop_duplicates('COL2', keep='first') # Keep last occurrence df = df.drop_duplicates('COL2', keep='last') # Remove all duplicates df = df.drop_duplicates('COL2', keep=False')</code>
Selepas melaksanakan mana-mana arahan di atas, dataframe df akan mengandungi hanya baris sepadan dengan nilai yang berbeza dalam lajur COL2:
COL1 COL2 0 a.com 22 1 b.com 45 2 c.com 34 4 f.com 56
Atas ialah kandungan terperinci Bagaimana Mengekstrak Baris Berdasarkan Nilai Berbeza dalam Lajur Bingkai Data?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!