Pandas 中的聚合
问题 1:如何使用 Pandas 进行聚合?
答案:
- Pandas 提供了各种聚合函数,例如 sum()、 mean()、count() 等
- 应用聚合之前按特定列分组,以汇总跨组数据。
问题 2:聚合后没有 DataFrame!发生了什么?
答案:
- 如果聚合结果是Series,请使用reset_index()。
- 如果是MultiIndex Series ,使用map()或str.replace()来压平
问题 3:如何聚合主要为字符串的列(列表、元组、带分隔符的字符串)?
答案:
- 将列表、元组或集合传递给聚合函数。
- 使用GroupBy.apply() 用于自定义聚合。
- 在字符串列上使用 .join() 创建带有分隔符的字符串。
问题 4:如何聚合计数?
答案:
- 使用GroupBy.size() 获取每组中的项目数量。
- 使用 GroupBy.count() 获取每组中的非缺失值数量。
- 使用 Series.value_counts()计算系列中的唯一值。
问题 5:如何创建由聚合填充的新列
答案:
- 使用 GroupBy.transform() 对每个组应用聚合函数,并根据结果生成一个新列。
以上是如何使用 Pandas 有效聚合数据?的详细内容。更多信息请关注PHP中文网其他相关文章!