刪除Pandas 資料框中的重複欄位
處理包含重複列的資料框時,有必要消除這些冗餘以獲得有效數據分析。本文提供了刪除 Pandas 中重複列的全面解決方案,解決了這個問題的各個方面。
重複的列名稱
要只根據重複名稱刪除列,一個簡單的解決方案是:
<code class="python">df = df.loc[:,~df.columns.duplicated()].copy()</code>
此行檢查重複的列名稱,並僅保留唯一的列名稱。
重複的列值
如果目標是基於重複值刪除列,則需要不同的方法而不轉置資料框:
<code class="python">df = df.loc[:,~df.apply(lambda x: x.duplicated(),axis=1).all()].copy()</code>
此方法檢查每個欄位中的重複值並消除所有值都是重複的欄位。
重複索引
要刪除重複索引,請遵循類似的方法:
<code class="python">df = df.loc[~df.index.duplicated(),:].copy()</code>
附加說明
以上是如何刪除 Pandas 資料框中的重複列?的詳細內容。更多資訊請關注PHP中文網其他相關文章!