使用Pandas GroupBy 連接多行字串
要使用Pandas 的groupby 連接多行字串,我們可以利用groupby 和技術轉換技術的組合。
考慮以下資料集,我們想要的地方連接每組「名稱」和「月份」的「文字」列:
import pandas as pd from io import StringIO data = StringIO( "\n".join([ '"name1","hej","2014-11-01"', '"name1","du","2014-11-02"', '"name1","aj","2014-12-01"', '"name1","oj","2014-12-02"', '"name2","fin","2014-11-01"', '"name2","katt","2014-11-02"', '"name2","mycket","2014-12-01"', '"name2","lite","2014-12-01"' ]) ) # Load and process the data df = pd.read_csv(data, header=0, names=["name", "text", "date"], parse_dates=["date"]) df["month"] = df["date"].apply(lambda x: x.month)
要連接每組「名稱」和「月份」的「文字」列,我們可以使用groupby 函數:
df['text'] = df[['name','text','month']].groupby(['name','month'])['text'].transform(lambda x: ','.join(x))
或者,我們可以使用apply函數並重設索引:
df.groupby(['name','month'])['text'].apply(','.join).reset_index()
這將產生一個新列,其中每個組的「文字」值連接起來:
name month text 0 name1 11 du 1 name1 12 aj,oj 2 name2 11 fin,katt 3 name2 12 mycket,lite
透過利用groupby 轉換技術,我們可以有效地連接來自多行的字串,增強資料分析和呈現。
以上是如何使用 GroupBy 連接多個 Pandas DataFrame 行中的字串?的詳細內容。更多資訊請關注PHP中文網其他相關文章!