不同值行檢索
要根據欄位(特別是COL2)中的不同值擷取行,可以使用下列方法:
drop_duplicates with Keep First:
df = df.drop_duplicates('COL2', keep='first')
這將保留 COL2 中每個唯一值的第一次出現。
drop_duplicates with Keep Last:
df = df.drop_duplicates('COL2', keep='last')
這會維護 COL2 中每個唯一值的最後一次出現。
drop_duplicates with No Keep:
df = df.drop_duplicates('COL2', keep=False)
這會刪除所有重複的行,從而在 COL2 中僅產生唯一值。
範例:
考慮下列資料封包:
COL1 | COL2 |
---|---|
a.com | 22 |
b.com | 45 |
c.com | 34 |
e.com | 45 |
f.com | 56 |
g.com | 22 |
h.com | 45 |
使用k >
keep_last方法產生:COL1 | COL2 |
---|---|
a.com | 22 |
b.com | 45 |
c.com | 34 |
f.com | 56 |
COL1 | COL2 |
---|---|
c.com | 34 |
f.com | 56 |
g.com | 22 |
h.com | 45 |
以上是如何在 Pandas DataFrame 中提取具有不同值的行?的詳細內容。更多資訊請關注PHP中文網其他相關文章!