如何识别 Python 中两个 Dataframe 之间的差异?

Linda Hamilton
发布: 2024-10-19 21:12:01
原创
156 人浏览过

How to Identify Differences Between Two Dataframes in Python?

比较两个数据帧以识别差异

要比较两个数据帧 df1 和 df2,并确定它们之间的差异,可以执行以下步骤采取:

由于提供的代码 df1 != df2 仅适用于具有相同行和列的数据帧,因此需要一种替代方法。将两个数据帧连接成一个数据帧 df,可以进行更彻底的比较。

<code class="python">import pandas as pd

df = pd.concat([df1, df2])</code>
登录后复制

连接后,重置 df 的索引以避免潜在的索引冲突。

<code class="python">df = df.reset_index(drop=True)</code>
登录后复制

按每一列对数据框进行分组,以标识唯一记录。

<code class="python">df_gpby = df.groupby(list(df.columns))</code>
登录后复制

提取唯一记录的索引,其中组的长度为 1。

<code class="python">idx = [x[0] for x in df_gpby.groups.values() if len(x) == 1]</code>
登录后复制

基于过滤数据框在唯一索引上获取 df1 和 df2 之间的差异。

<code class="python">result = df.reindex(idx)</code>
登录后复制

生成的结果数据帧将包含 df2 中但不包含 df1 中的行。

以上是如何识别 Python 中两个 Dataframe 之间的差异?的详细内容。更多信息请关注PHP中文网其他相关文章!

来源:php
本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
作者最新文章
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责声明 Sitemap
PHP中文网:公益在线PHP培训,帮助PHP学习者快速成长!