首頁 > 後端開發 > Python教學 > 如何使用 GroupBy 連接多個 Pandas DataFrame 行中的字串?

如何使用 GroupBy 連接多個 Pandas DataFrame 行中的字串?

Patricia Arquette
發布: 2024-12-14 14:05:13
原創
469 人瀏覽過

How to Concatenate Strings from Multiple Pandas DataFrame Rows using GroupBy?

使用Pandas GroupBy 連接多行字串

要使用Pandas 的groupby 連接多行字串,我們可以利用groupby 和技術轉換技術的組合。

考慮以下資料集,我們想要的地方連接每組「名稱」和「月份」的「文字」列:

import pandas as pd
from io import StringIO

data = StringIO(
    "\n".join([
        '"name1","hej","2014-11-01"',
        '"name1","du","2014-11-02"',
        '"name1","aj","2014-12-01"',
        '"name1","oj","2014-12-02"',
        '"name2","fin","2014-11-01"',
        '"name2","katt","2014-11-02"',
        '"name2","mycket","2014-12-01"',
        '"name2","lite","2014-12-01"'
    ])
)

# Load and process the data
df = pd.read_csv(data, header=0, names=["name", "text", "date"], parse_dates=["date"])
df["month"] = df["date"].apply(lambda x: x.month)
登入後複製

要連接每組「名稱」和「月份」的「文字」列,我們可以使用groupby 函數:

df['text'] = df[['name','text','month']].groupby(['name','month'])['text'].transform(lambda x: ','.join(x))
登入後複製

或者,我們可以使用apply函數並重設索引:

df.groupby(['name','month'])['text'].apply(','.join).reset_index()
登入後複製

這將產生一個新列,其中每個組的「文字」值連接起來:

    name  month         text
0  name1     11           du
1  name1     12        aj,oj
2  name2     11     fin,katt
3  name2     12  mycket,lite
登入後複製

透過利用groupby 轉換技術,我們可以有效地連接來自多行的字串,增強資料分析和呈現。

以上是如何使用 GroupBy 連接多個 Pandas DataFrame 行中的字串?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

來源:php.cn
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
作者最新文章
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板