使用 Pandas GroupBy 连接多行字符串
要使用 Pandas 的 groupby 连接多行字符串,我们可以利用groupby 和转换技术的组合。
考虑以下数据集,我们想要的地方连接每组“名称”和“月份”的“文本”列:
import pandas as pd from io import StringIO data = StringIO( "\n".join([ '"name1","hej","2014-11-01"', '"name1","du","2014-11-02"', '"name1","aj","2014-12-01"', '"name1","oj","2014-12-02"', '"name2","fin","2014-11-01"', '"name2","katt","2014-11-02"', '"name2","mycket","2014-12-01"', '"name2","lite","2014-12-01"' ]) ) # Load and process the data df = pd.read_csv(data, header=0, names=["name", "text", "date"], parse_dates=["date"]) df["month"] = df["date"].apply(lambda x: x.month)
要连接每组“名称”和“月份”的“文本”列,我们可以使用groupby 函数:
df['text'] = df[['name','text','month']].groupby(['name','month'])['text'].transform(lambda x: ','.join(x))
或者,我们可以使用 apply 函数并重置索引:
df.groupby(['name','month'])['text'].apply(','.join).reset_index()
这将产生一个新列,其中每个组的“文本”值连接起来:
name month text 0 name1 11 du 1 name1 12 aj,oj 2 name2 11 fin,katt 3 name2 12 mycket,lite
通过利用 groupby 转换技术,我们可以有效地连接来自多行的字符串,增强数据分析和呈现。
以上是如何使用 GroupBy 连接多个 Pandas DataFrame 行中的字符串?的详细内容。更多信息请关注PHP中文网其他相关文章!