Menggabungkan Rentetan daripada Berbilang Baris menggunakan Pandas GroupBy
Untuk menggabungkan rentetan daripada berbilang baris dalam lajur menggunakan kumpulan Pandas, kita boleh memanfaatkan gabungan teknik kumpulan mengikut dan transformasi.
Pertimbangkan set data berikut, di mana kita mahu untuk menggabungkan lajur "teks" bagi setiap kumpulan "nama" dan "bulan":
import pandas as pd from io import StringIO data = StringIO( "\n".join([ '"name1","hej","2014-11-01"', '"name1","du","2014-11-02"', '"name1","aj","2014-12-01"', '"name1","oj","2014-12-02"', '"name2","fin","2014-11-01"', '"name2","katt","2014-11-02"', '"name2","mycket","2014-12-01"', '"name2","lite","2014-12-01"' ]) ) # Load and process the data df = pd.read_csv(data, header=0, names=["name", "text", "date"], parse_dates=["date"]) df["month"] = df["date"].apply(lambda x: x.month)
Untuk menggabungkan lajur "teks" bagi setiap kumpulan "nama" dan "bulan", kita boleh menggunakan fungsi groupby:
df['text'] = df[['name','text','month']].groupby(['name','month'])['text'].transform(lambda x: ','.join(x))
Sebagai alternatif, kita boleh menggunakan fungsi apply dan menetapkan semula indeks:
df.groupby(['name','month'])['text'].apply(','.join).reset_index()
Ini akan menghasilkan lajur baharu yang mana nilai "teks" digabungkan untuk setiap kumpulan:
name month text 0 name1 11 du 1 name1 12 aj,oj 2 name2 11 fin,katt 3 name2 12 mycket,lite
Dengan menggunakan teknik transformasi kumpulan mengikut, kami boleh menggabungkan rentetan daripada berbilang baris dengan cekap, meningkatkan analisis data dan pembentangan.
Atas ialah kandungan terperinci Bagaimana untuk Menggabungkan Rentetan daripada Baris DataFrame Berbilang Panda menggunakan GroupBy?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!