如何计算 Pandas DataFrame 中相同行的频率?

Barbara Streisand
发布: 2024-10-25 08:01:02
原创
476 人浏览过

How to Count the Frequency of Identical Rows in a Pandas DataFrame?

根据多个 Dataframe 列获取频率计数

要确定相同行在数据框中出现的频率,我们可以使用 Pandas 的 groupby功能。考虑以下示例:

data = {'Group': ['Short', 'Short', 'Moderate', 'Moderate', 'Tall'], 'Size': ['Small', 'Small', 'Medium', 'Small', 'Large']}
df = pd.DataFrame(data)
登录后复制

我们可以通过三种方式计算频率计数:

选项 1:

dfg = df.groupby(by=["Group", "Size"]).size()
登录后复制

这会产生具有以下输出的系列:

Group     Size
Moderate  Medium    1
          Small     1
Short     Small     2
Tall      Large     1
dtype: int64
登录后复制

选项 2:

dfg = df.groupby(by=["Group", "Size"]).size().reset_index(name="Time")
登录后复制

这会生成一个添加了“时间”列的 DataFrame:

      Group    Size  Time
0  Moderate  Medium     1
1  Moderate   Small     1
2     Short   Small     2
3      Tall   Large     1
登录后复制

选项 3:

dfg = df.groupby(by=["Group", "Size"], as_index=False).size()
登录后复制

这也会生成一个 DataFrame,相当于选项 2 的输出。

以上是如何计算 Pandas DataFrame 中相同行的频率?的详细内容。更多信息请关注PHP中文网其他相关文章!

来源:php.cn
本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
作者最新文章
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责声明 Sitemap
PHP中文网:公益在线PHP培训,帮助PHP学习者快速成长!