Pendapatan Baris Nilai Berbeza
Untuk mengekstrak baris berdasarkan nilai berbeza dalam lajur, khususnya COL2, kaedah berikut boleh digunakan:
drop_duplicates dengan Keep First:
df = df.drop_duplicates('COL2', keep='first')
Ini mengekalkan kejadian pertama setiap nilai unik dalam COL2.
drop_duplicates dengan Keep Last:
df = df.drop_duplicates('COL2', keep='last')
Ini mengekalkan kejadian terakhir setiap nilai unik dalam COL2.
drop_duplicates dengan No Keep:
df = df.drop_duplicates('COL2', keep=False)
Ini mengalih keluar semua baris pendua, menghasilkan hanya nilai unik dalam COL2.
Contoh:
Pertimbangkan kerangka data berikut:
COL1 | COL2 |
---|---|
a.com | 22 |
b.com | 45 |
c.com | 34 |
e.com | 45 |
f.com | 56 |
g.com | 22 |
h.com | 45 |
Menggunakan kaedah keep_first menghasilkan:
COL1 | COL2 |
---|---|
a.com | 22 |
b.com | 45 |
c.com | 34 |
f.com | 56 |
Kaedah keep_last menghasilkan:
COL1 | COL2 |
---|---|
c.com | 34 |
f.com | 56 |
g.com | 22 |
h.com | 45 |
Akhir sekali, menggunakan kaedah keep_false menghasilkan:
COL1 | COL2 |
---|---|
c.com | 34 |
f.com | 56 |
Atas ialah kandungan terperinci Bagaimana untuk Mengekstrak Baris dengan Nilai Berbeza dalam Pandas DataFrame?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!