Menggabungkan Rentetan daripada Berbilang Baris Menggunakan Pandas Groupby
Dalam bidang manipulasi data dengan Panda, selalunya perlu untuk menggabungkan rentetan daripada berbilang baris berdasarkan kriteria tertentu. Operasi Groupby menyediakan cara yang berkesan untuk mencapai matlamat ini. Mari kita teliti contoh praktikal.
Andaikan kita mempunyai DataFrame dengan lajur "nama," "teks" dan "tarikh." Kami ingin menggabungkan entri "teks" untuk setiap gabungan unik "nama" dan "bulan." Untuk mencapainya, kita boleh menggunakan langkah berikut:
GroupBy and Transform: Himpunkan DataFrame mengikut lajur "nama" dan "bulan". Kemudian, gunakan operasi transformasi dan gunakan fungsi lambda untuk menyertai entri "teks" dengan pemisah koma:
df['text'] = df[['name','text','month']].groupby(['name','month'])['text'].transform(lambda x: ','.join(x))
Alih Keluar Pendua: Transformasi ' lajur teks mungkin mengandungi entri pendua. Untuk mengekalkan entri unik, lepaskan pendua berdasarkan lajur "nama" dan "bulan":
df[['name','text','month']].drop_duplicates()
Sebagai alternatif, kami boleh memudahkan proses dengan menggunakan apply dan reset_index untuk mendapatkan yang diingini output:
df.groupby(['name','month'])['text'].apply(','.join).reset_index()
Kaedah ini membolehkan penyatuan rentetan yang cekap daripada berbilang baris dalam Panda DataFrame, menjadikan tugasan manipulasi data lebih mudah diurus.
Atas ialah kandungan terperinci Bagaimanakah Saya Boleh Menggabungkan Rentetan daripada Baris DataFrame Berbilang Panda Menggunakan Groupby?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!