带有分隔符连接的 Pandas Groupby
使用 Pandas 库,您可以使用 groupby 函数对具有多个值的行进行分组。但是,默认情况下,这些值是在没有分隔符的情况下连接的。本文解决了引入分隔符来分隔每个组中的值的问题。
您最初尝试使用 apply() 函数用破折号 (-) 连接值,但这导致整个连接字符串而不是分隔各个值。
更直接的方法是使用带有 join 参数的 agg() 函数。以下是实现所需输出的方法:
group = df.groupby('col')['val'].agg('-'.join)
这将使用破折号作为分隔符连接每个组中的值。结果将是:
col A Cat-Tiger B Ball-Bat
请注意,索引仍然存在于输出中,如果要将其转换为列,可以使用 reset_index() 函数:
df1 = group.reset_index(name='new')
这会将索引转换为名为 new 的新列。最终输出将是:
col new 0 A Cat-Tiger 1 B Ball-Bat
或者,您可以使用squeeze()函数(注意这个函数在Pandas 1.4.0中被制作为as_nunique函数)来完全删除索引并获得一个Series对象:
group.squeeze()
这将产生一个由指定值连接的分组值的系列分隔符:
col A Cat-Tiger B Ball-Bat Name: val
以上是如何使用 Pandas Groupby 将值与分隔符连接起来?的详细内容。更多信息请关注PHP中文网其他相关文章!