Rumah > pembangunan bahagian belakang > Tutorial Python > Bagaimana untuk Menggabungkan Rentetan daripada Baris DataFrame Berbilang Panda menggunakan GroupBy?

Bagaimana untuk Menggabungkan Rentetan daripada Baris DataFrame Berbilang Panda menggunakan GroupBy?

Patricia Arquette
Lepaskan: 2024-12-14 14:05:13
asal
470 orang telah melayarinya

How to Concatenate Strings from Multiple Pandas DataFrame Rows using GroupBy?

Menggabungkan Rentetan daripada Berbilang Baris menggunakan Pandas GroupBy

Untuk menggabungkan rentetan daripada berbilang baris dalam lajur menggunakan kumpulan Pandas, kita boleh memanfaatkan gabungan teknik kumpulan mengikut dan transformasi.

Pertimbangkan set data berikut, di mana kita mahu untuk menggabungkan lajur "teks" bagi setiap kumpulan "nama" dan "bulan":

import pandas as pd
from io import StringIO

data = StringIO(
    "\n".join([
        '"name1","hej","2014-11-01"',
        '"name1","du","2014-11-02"',
        '"name1","aj","2014-12-01"',
        '"name1","oj","2014-12-02"',
        '"name2","fin","2014-11-01"',
        '"name2","katt","2014-11-02"',
        '"name2","mycket","2014-12-01"',
        '"name2","lite","2014-12-01"'
    ])
)

# Load and process the data
df = pd.read_csv(data, header=0, names=["name", "text", "date"], parse_dates=["date"])
df["month"] = df["date"].apply(lambda x: x.month)
Salin selepas log masuk

Untuk menggabungkan lajur "teks" bagi setiap kumpulan "nama" dan "bulan", kita boleh menggunakan fungsi groupby:

df['text'] = df[['name','text','month']].groupby(['name','month'])['text'].transform(lambda x: ','.join(x))
Salin selepas log masuk

Sebagai alternatif, kita boleh menggunakan fungsi apply dan menetapkan semula indeks:

df.groupby(['name','month'])['text'].apply(','.join).reset_index()
Salin selepas log masuk

Ini akan menghasilkan lajur baharu yang mana nilai "teks" digabungkan untuk setiap kumpulan:

    name  month         text
0  name1     11           du
1  name1     12        aj,oj
2  name2     11     fin,katt
3  name2     12  mycket,lite
Salin selepas log masuk

Dengan menggunakan teknik transformasi kumpulan mengikut, kami boleh menggabungkan rentetan daripada berbilang baris dengan cekap, meningkatkan analisis data dan pembentangan.

Atas ialah kandungan terperinci Bagaimana untuk Menggabungkan Rentetan daripada Baris DataFrame Berbilang Panda menggunakan GroupBy?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:php.cn
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Artikel terbaru oleh pengarang
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan