Pandas 数据分组计数和最大计数检索
问题:
给定一个 Pandas DataFrame对于多列,如何按两个特定列有效地将行分组并获取每组中的计数?此外,如何确定分组列之一中每个值的最大计数?
解决方案:
按两列对 DataFrame 行进行分组并计算出现次数,使用 groupby() 函数,然后使用 size() 方法:
<code class="python">df.groupby(['col5', 'col2']).size()</code>
此操作根据指定的列创建组,并返回每个组中的行数。输出将类似于以下内容:
col5 col2 count 1 A 1 D 3 2 B 2 ...
要查找 col2 列中每个值的最大计数:
<code class="python">df.groupby(['col5', 'col2']).size().groupby(level=1).max()</code>
此操作按 col2 列级别对计数数据进行分组,并且返回每个 col2 值的最大计数,产生如下输出:
col2 A 3 B 2 C 1 D 3
附加说明:
按多列分组并获取计数和附加摘要统计信息,您可以将 groupby() 与 agg() 等其他方法结合使用,它允许您指定多个聚合函数:
<code class="python">df.groupby(['col5', 'col2']).agg(['count', 'mean', 'max'])</code>
以上是如何对 Pandas 数据进行分组、计算出现次数并查找最大计数?的详细内容。更多信息请关注PHP中文网其他相关文章!