Bagaimana untuk Menambah Lajur Agregat pada Bingkai Data Berkumpulan dalam Panda?

Patricia Arquette
Lepaskan: 2024-10-19 11:46:01
asal
513 orang telah melayarinya

How to Add Aggregated Columns to Grouped DataFrames in Pandas?

Menambah Lajur pada Bingkai Data Berkumpulan dalam Panda

Apabila bekerja dengan bingkai data dalam Pandas, selalunya perlu untuk mengumpulkan data dan nilai agregat dalam kumpulan. Biasanya, ini melibatkan penciptaan kerangka data berasingan dengan hasil pengagregatan. Walau bagaimanapun, ia juga berguna untuk menambah lajur agregat ini terus ke bingkai data asal.

Mari kita ilustrasikan ini dengan contoh bingkai data yang mudah:

<code class="python">df = pd.DataFrame({'c': [1, 1, 1, 2, 2, 2, 2], 'type': ['m', 'n', 'o', 'm', 'm', 'n', 'n']})</code>
Salin selepas log masuk

Untuk mengira nilai 'jenis' untuk setiap nilai 'c', kita boleh menggunakan kod berikut:

<code class="python">g = df.groupby('c')['type'].value_counts().reset_index(name='t')</code>
Salin selepas log masuk

Ini mencipta kerangka data baharu 'g' dengan tiga lajur: 'c', 'type' dan 't' mewakili kiraan setiap 'jenis' dalam setiap 'c'.

Seterusnya, kita boleh menggunakan kaedah 'size()' untuk mengira bilangan baris dalam setiap kumpulan:

<code class="python">a = df.groupby('c').size().reset_index(name='size')</code>
Salin selepas log masuk

Ini mencipta bingkai data baharu 'a' dengan dua lajur: 'c' dan 'saiz' yang mengandungi bilangan baris dalam setiap kumpulan 'c'.

Untuk menambah lajur 'saiz' pada bingkai data asal, satu pilihan ialah menggunakan fungsi 'map()' seperti yang ditunjukkan dalam soalan. Walau bagaimanapun, pendekatan yang lebih mudah ialah menggunakan kaedah 'transform()':

<code class="python">g['size'] = df.groupby('c')['type'].transform('size')</code>
Salin selepas log masuk

Kaedah 'transform()' mengembalikan Siri dengan indeksnya sejajar dengan kerangka data asal. Dengan memperuntukkan Siri ini kepada lajur baharu dalam bingkai data terkumpul, kami menambahkan nilai agregat kembali ke kerangka data asal dengan berkesan.

Bingkai data 'g' yang terhasil kini akan mengandungi lajur 'saiz' tambahan:

   c type  t  size
0  1    m  1     3
1  1    n  1     3
2  1    o  1     3
3  2    m  2     4
4  2    n  2     4
Salin selepas log masuk

Pendekatan ini menyediakan cara yang mudah dan cekap untuk menambah lajur teragregat pada bingkai data terkumpul dalam Panda.

Atas ialah kandungan terperinci Bagaimana untuk Menambah Lajur Agregat pada Bingkai Data Berkumpulan dalam Panda?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:php
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Artikel terbaru oleh pengarang
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan