向 Pandas 中的分组数据框添加列
在 Pandas 中使用数据框时,通常需要对数据进行分组并聚合其中的值组。通常,这涉及使用聚合结果创建单独的数据帧。但是,将这些聚合列直接添加到原始数据框也很有用。
让我们用一个简单的示例数据框来说明这一点:
<code class="python">df = pd.DataFrame({'c': [1, 1, 1, 2, 2, 2, 2], 'type': ['m', 'n', 'o', 'm', 'm', 'n', 'n']})</code>
计算“type”的值对于“c”的每个值,我们可以使用以下代码:
<code class="python">g = df.groupby('c')['type'].value_counts().reset_index(name='t')</code>
这将创建一个新的数据框“g”,其中包含三列:“c”、“type”和“t”,分别代表每个“c”中每个“类型”的计数。
接下来,我们可以使用“size()”方法来计算每个组中的行数:
<code class="python">a = df.groupby('c').size().reset_index(name='size')</code>
这个创建一个包含两列的新数据框“a”:“c”和“size”,其中包含每个“c”组中的行数。
要将“size”列添加到原始数据框,有一个选项是使用问题中所示的“map()”函数。然而,更直接的方法是使用 'transform()' 方法:
<code class="python">g['size'] = df.groupby('c')['type'].transform('size')</code>
'transform()' 方法返回一个 Series,其索引与原始数据帧对齐。通过将此系列分配给分组数据框中的新列,我们可以有效地将聚合值添加回原始数据框。
生成的数据框“g”现在将包含附加的“size”列:
c type t size 0 1 m 1 3 1 1 n 1 3 2 1 o 1 3 3 2 m 2 4 4 2 n 2 4
这种方法提供了一种简单有效的方法来将聚合列添加到 Pandas 中的分组数据帧中。
以上是如何将聚合列添加到 Pandas 中的分组 DataFrame 中?的详细内容。更多信息请关注PHP中文网其他相关文章!