如何删除 Pandas 数据框中的重复列?

DDD
发布: 2024-11-01 14:08:02
原创
222 人浏览过

How to Remove Duplicate Columns in a Pandas Dataframe?

删除 Pandas 数据框中的重复列

处理包含重复列的数据框时,有必要消除这些冗余以获得有效数据分析。本文提供了删除 Pandas 中重复列的全面解决方案,解决了该问题的各个方面。

重复的列名称

要仅根据重复名称删除列,一个简单的解决方案是:

<code class="python">df = df.loc[:,~df.columns.duplicated()].copy()</code>
登录后复制

此行检查重复的列名称,并仅保留唯一的列名称。

重复的列值

如果目标是基于重复值删除列,则需要采用不同的方法而不转置数据框:

<code class="python">df = df.loc[:,~df.apply(lambda x: x.duplicated(),axis=1).all()].copy()</code>
登录后复制

此方法检查每列中的重复值并消除所有值都是重复的列。

重复索引

要删除重复索引,请遵循类似的方法:

<code class="python">df = df.loc[~df.index.duplicated(),:].copy()</code>
登录后复制

附加说明

  • 提供的解决方案假设数据帧已加载到名为 df 的变量中。
  • ~df.columns.duplicated() 和 ~df.index.duplicated() 返回布尔数组,指示哪些列或索引重复。
  • ~df.apply(lambda x: x.duplicated(),axis=1).all() 中的 all() 函数检查列中的所有值是否重复。
  • .copy() 方法用于创建经过修改的新数据框,避免修改现有数据框时出现任何问题。

以上是如何删除 Pandas 数据框中的重复列?的详细内容。更多信息请关注PHP中文网其他相关文章!

来源:php.cn
本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责声明 Sitemap
PHP中文网:公益在线PHP培训,帮助PHP学习者快速成长!