使用 Pandas Transform 将列添加到 GroupBy DataFrame
在 pandas 中使用 groupby 操作时,向 GroupBy 添加新列通常很有用结果数据框。实现此目的的一种方法是使用 .map() 函数,如示例中所示。然而,另一种更直接的方法是使用 .transform() 函数。
.transform() 允许我们将函数应用于数据帧中的每个组并返回带有结果的 Series。返回的 Series 将具有与原始数据帧对齐的索引。
为了说明这一点,让我们从提供的数据帧开始:
df = pd.DataFrame({'c': [1, 1, 1, 2, 2, 2, 2], 'type': ['m', 'n', 'o', 'm', 'm', 'n', 'n']})
我们的目标是计算每个 c 的 type 值并添加一个大小为 c 的列。
g = df.groupby('c')['type'].value_counts().reset_index(name='t')
此代码计算每个组的值并创建一个名为 t 的新列。
使用 .transform( 添加大小列),我们可以执行以下操作:
g['size'] = df.groupby('c')['type'].transform('size')
.transform('size') 将 size 函数应用于每个组,该函数返回每个组的大小。生成的 Series 与原始数据帧的索引对齐,允许我们将其作为新列添加到 g。
输出将是一个带有名为 size 的附加列的数据帧:
c type t size 0 1 m 1 3 1 1 n 1 3 2 1 o 1 3 3 2 m 2 4 4 2 n 2 4
使用 .transform() 提供了一种更简洁、更直接的方法,可以将列从 groupby 聚合添加回原始数据帧。
以上是如何在 GroupBy DataFrames 中使用 Pandas 转换添加列?的详细内容。更多信息请关注PHP中文网其他相关文章!