如何对 Pandas 数据进行分组、计算出现次数并查找最大计数?

Mary-Kate Olsen
发布: 2024-10-23 13:40:02
原创
625 人浏览过

How to Group Pandas Data, Count Occurrences, and Find Maximum Counts?

Pandas 数据分组计数和最大计数检索

问题:

给定一个 Pandas DataFrame对于多列,如何按两个特定列有效地将行分组并获取每组中的计数?此外,如何确定分组列之一中每个值的最大计数?

解决方案:

按两列对 DataFrame 行进行分组并计算出现次数,使用 groupby() 函数,然后使用 size() 方法:

<code class="python">df.groupby(['col5', 'col2']).size()</code>
登录后复制

此操作根据指定的列创建组,并返回每个组中的行数。输出将类似于以下内容:

col5  col2  count
1     A       1
      D       3
2     B       2
...
登录后复制

要查找 col2 列中每个值的最大计数:

<code class="python">df.groupby(['col5', 'col2']).size().groupby(level=1).max()</code>
登录后复制

此操作按 col2 列级别对计数数据进行分组,并且返回每个 col2 值的最大计数,产生如下输出:

col2
A       3
B       2
C       1
D       3
登录后复制

附加说明:

按多列分组并获取计数和附加摘要统计信息,您可以将 groupby() 与 agg() 等其他方法结合使用,它允许您指定多个聚合函数:

<code class="python">df.groupby(['col5', 'col2']).agg(['count', 'mean', 'max'])</code>
登录后复制

以上是如何对 Pandas 数据进行分组、计算出现次数并查找最大计数?的详细内容。更多信息请关注PHP中文网其他相关文章!

来源:php
本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
作者最新文章
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责声明 Sitemap
PHP中文网:公益在线PHP培训,帮助PHP学习者快速成长!