首页 > 后端开发 > Python教程 > 如何使用 GroupBy 连接多个 Pandas DataFrame 行中的字符串?

如何使用 GroupBy 连接多个 Pandas DataFrame 行中的字符串?

Patricia Arquette
发布: 2024-12-14 14:05:13
原创
470 人浏览过

How to Concatenate Strings from Multiple Pandas DataFrame Rows using GroupBy?

使用 Pandas GroupBy 连接多行字符串

要使用 Pandas 的 groupby 连接多行字符串,我们可以利用groupby 和转换技术的组合。

考虑以下数据集,我们想要的地方连接每组“名称”和“月份”的“文本”列:

import pandas as pd
from io import StringIO

data = StringIO(
    "\n".join([
        '"name1","hej","2014-11-01"',
        '"name1","du","2014-11-02"',
        '"name1","aj","2014-12-01"',
        '"name1","oj","2014-12-02"',
        '"name2","fin","2014-11-01"',
        '"name2","katt","2014-11-02"',
        '"name2","mycket","2014-12-01"',
        '"name2","lite","2014-12-01"'
    ])
)

# Load and process the data
df = pd.read_csv(data, header=0, names=["name", "text", "date"], parse_dates=["date"])
df["month"] = df["date"].apply(lambda x: x.month)
登录后复制

要连接每组“名称”和“月份”的“文本”列,我们可以使用groupby 函数:

df['text'] = df[['name','text','month']].groupby(['name','month'])['text'].transform(lambda x: ','.join(x))
登录后复制

或者,我们可以使用 apply 函数并重置索引:

df.groupby(['name','month'])['text'].apply(','.join).reset_index()
登录后复制

这将产生一个新列,其中每个组的“文本”值连接起来:

    name  month         text
0  name1     11           du
1  name1     12        aj,oj
2  name2     11     fin,katt
3  name2     12  mycket,lite
登录后复制

通过利用 groupby 转换技术,我们可以有效地连接来自多行的字符串,增强数据分析和呈现。

以上是如何使用 GroupBy 连接多个 Pandas DataFrame 行中的字符串?的详细内容。更多信息请关注PHP中文网其他相关文章!

来源:php.cn
本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
作者最新文章
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板