如何计算熊猫多个组内的平均值?

Mary-Kate Olsen
发布: 2024-11-14 12:49:01
原创
427 人浏览过

How to Calculate Average Values Within Multiple Groups in Pandas?

按多列分组并计算平均值

在 Pandas 中,您可以执行多级分组和聚合来计算复杂的统计数据。一项常见任务是计算由多个其他列定义的组内的一列的平均值。

考虑以下 DataFrame:

cluster  org      time
1      a       8
1      a       6
2      h       34
1      c       23
2      d       74
3      w       6 
登录后复制

计算每个集群中每个组织的平均时间,您可以按集群和组织对 DataFrame 进行分组:

df.groupby(['cluster', 'org'], as_index=False).mean()
登录后复制

这将生成按集群和组织分组的 DataFrame,并计算每组的平均时间:

  cluster org     time
0       1   a  12.333333
1       1   c   23.0
2       2   h   34.0
3       2   d   74.0
4       3   w    6.0
登录后复制

如果您只需要每个集群内的平均时间,则可以仅按集群分组:

df.groupby('cluster').mean()
登录后复制

这将生成一个 DataFrame,其中计算每个集群的平均时间:

  cluster  time
0       1   12.333333
1       2   54.0
2       3    6.0
登录后复制

或者,您可以对多列组合 ['cluster', 'org'] 使用 groupby 方法,然后计算时间平均值:

df.groupby(['cluster', 'org']).mean()['time']
登录后复制

这将产生一个包含以下内容的 Series为集群和组织的每个组合计算的平均时间。

以上是如何计算熊猫多个组内的平均值?的详细内容。更多信息请关注PHP中文网其他相关文章!

来源:php.cn
本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
作者最新文章
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板