如何将聚合列添加到 Pandas 中的分组 DataFrame 中?

Patricia Arquette
发布: 2024-10-19 11:46:01
原创
416 人浏览过

How to Add Aggregated Columns to Grouped DataFrames in Pandas?

向 Pandas 中的分组数据框添加列

在 Pandas 中使用数据框时,通常需要对数据进行分组并聚合其中的值组。通常,这涉及使用聚合结果创建单独的数据帧。但是,将这些聚合列直接添加到原始数据框也很有用。

让我们用一个简单的示例数据框来说明这一点:

<code class="python">df = pd.DataFrame({'c': [1, 1, 1, 2, 2, 2, 2], 'type': ['m', 'n', 'o', 'm', 'm', 'n', 'n']})</code>
登录后复制

计算“type”的值对于“c”的每个值,我们可以使用以下代码:

<code class="python">g = df.groupby('c')['type'].value_counts().reset_index(name='t')</code>
登录后复制

这将创建一个新的数据框“g”,其中包含三列:“c”、“type”和“t”,分别代表每个“c”中每个“类型”的计数。

接下来,我们可以使用“size()”方法来计算每个组中的行数:

<code class="python">a = df.groupby('c').size().reset_index(name='size')</code>
登录后复制

这个创建一个包含两列的新数据框“a”:“c”和“size”,其中包含每个“c”组中的行数。

要将“size”列添加到原始数据框,有一个选项是使用问题中所示的“map()”函数。然而,更直接的方法是使用 'transform()' 方法:

<code class="python">g['size'] = df.groupby('c')['type'].transform('size')</code>
登录后复制

'transform()' 方法返回一个 Series,其索引与原始数据帧对齐。通过将此系列分配给分组数据框中的新列,我们可以有效地将聚合值添加回原始数据框。

生成的数据框“g”现在将包含附加的“size”列:

   c type  t  size
0  1    m  1     3
1  1    n  1     3
2  1    o  1     3
3  2    m  2     4
4  2    n  2     4
登录后复制

这种方法提供了一种简单有效的方法来将聚合列添加到 Pandas 中的分组数据帧中。

以上是如何将聚合列添加到 Pandas 中的分组 DataFrame 中?的详细内容。更多信息请关注PHP中文网其他相关文章!

来源:php
本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
作者最新文章
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责声明 Sitemap
PHP中文网:公益在线PHP培训,帮助PHP学习者快速成长!