首页 > 后端开发 > Python教程 > Pandas 中的 `groupby().count()` 和 `groupby().size()` 有什么区别?

Pandas 中的 `groupby().count()` 和 `groupby().size()` 有什么区别?

Linda Hamilton
发布: 2024-11-28 17:38:11
原创
721 人浏览过

What's the Difference Between `groupby().count()` and `groupby().size()` in Pandas?

理解 Pandas 中大小和计数的区别

Pandas 是一个强大的用于数据操作和分析的 Python 库,提供灵活的操作,例如按类别对数据进行分组。在处理分组数据时,理解 count 和 size 方法之间的区别至关重要。

问题:Pandas 中 groupby("x").count 和 groupby("x").size 的区别? size 是否仅仅排除空值?

答案:

count 和 size 之间的区别在于它们对 NaN 值的处理:

  • size: 包括 NaN 值,本质上提供每个中的观察总数组。
  • 计数: 排除 NaN 值,生成每个组的非空观测值的数量。

示例:

考虑以下熊猫DataFrame:

df = pd.DataFrame({'a':[0,0,1,2,2,2], 'b':[1,2,3,4,np.NaN,4], 'c':np.random.randn(6)})
登录后复制

评估按 'a' 分组的 'b' 列的计数和大小方法:

print(df.groupby(['a'])['b'].count())
print(df.groupby(['a'])['b'].size())
登录后复制

输出:

a
0    2
1    1
2    2
Name: b, dtype: int64

a
0    2
1    1
2    3
dtype: int64
登录后复制

很明显,count 方法排除了第 4 组中的 NaN 值(其中 'a' 是2),而size方法则包含它。

以上是Pandas 中的 `groupby().count()` 和 `groupby().size()` 有什么区别?的详细内容。更多信息请关注PHP中文网其他相关文章!

来源:php.cn
本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
作者最新文章
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板