如何取得 Pandas DataFrame 中重複項的完整清單?
Oct 26, 2024 am 03:35 AM取得Pandas 中所有重複項目的清單
在pandas 中,duplicated 方法可用於基於資料集識別重複行在指定的列上。但是,預設情況下,它僅傳回每個重複項的第一次出現。要獲得完整的列表,請考慮以下方法:
方法#1:使用isin 方法進行過濾
此方法涉及兩個步驟:
-
使用以下方法從重複行中提取唯一ID:
<code class="python">ids = df[df.duplicated(cols='ID')]['ID']</code>
登入後複製 -
利用isin 方法過濾ID 與任何重複ID 匹配的所有行:
<code class="python">df[ids.isin(ids[ids.duplicated()])].sort_values("ID")</code>
登入後複製
方法#2:使用groupby 進行分組
此方法使用groupby 操作按ID 列對行進行分組並過濾掉包含多行的分組:
<code class="python">pd.concat(g for _, g in df.groupby("ID") if len(g) > 1)</code>
登入後複製
透過使用這些方法,您可以有效地檢索pandas DataFrame 中重複項的完整清單。
以上是如何取得 Pandas DataFrame 中重複項的完整清單?的詳細內容。更多資訊請關注PHP中文網其他相關文章!
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱門文章
兩個點博物館:邦格荒地地點指南
4 週前
By 尊渡假赌尊渡假赌尊渡假赌
擊敗分裂小說需要多長時間?
3 週前
By DDD
倉庫:如何復興隊友
3 週前
By 尊渡假赌尊渡假赌尊渡假赌
Hello Kitty Island冒險:如何獲得巨型種子
3 週前
By 尊渡假赌尊渡假赌尊渡假赌
公眾號網頁更新緩存難題:如何避免版本更新後舊緩存影響用戶體驗?
3 週前
By 王林

熱門文章
兩個點博物館:邦格荒地地點指南
4 週前
By 尊渡假赌尊渡假赌尊渡假赌
擊敗分裂小說需要多長時間?
3 週前
By DDD
倉庫:如何復興隊友
3 週前
By 尊渡假赌尊渡假赌尊渡假赌
Hello Kitty Island冒險:如何獲得巨型種子
3 週前
By 尊渡假赌尊渡假赌尊渡假赌
公眾號網頁更新緩存難題:如何避免版本更新後舊緩存影響用戶體驗?
3 週前
By 王林

熱門文章標籤

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)