Rumah > pembangunan bahagian belakang > Tutorial Python > Bagaimana untuk Mengira Statistik Bijak Kumpulan dalam Panda Menggunakan GroupBy?

Bagaimana untuk Mengira Statistik Bijak Kumpulan dalam Panda Menggunakan GroupBy?

Patricia Arquette
Lepaskan: 2024-12-19 21:26:11
asal
986 orang telah melayarinya

How to Calculate Group-Wise Statistics in Pandas Using GroupBy?

Cara Mendapatkan Statistik Bijak Kumpulan untuk Bingkai Data Menggunakan Pandas GroupBy

Apabila bekerja dengan data, selalunya berguna untuk dapat meringkaskan dan menganalisis data berdasarkan spesifik kriteria pengelompokan. Pandas, perpustakaan Python yang berkuasa untuk manipulasi dan analisis data, menyediakan cara yang mudah untuk melakukan ini melalui fungsi GroupBy.

Jawapan Pantas

Untuk mendapatkan kiraan baris dalam setiap kumpulan, gunakan saiz .size () kaedah, yang mengembalikan Siri:

df.groupby(['col1','col2']).size()
Salin selepas log masuk

Untuk menukar ini kepada borang DataFrame, menggunakan:

df.groupby(['col1', 'col2']).size().reset_index(name='counts')
Salin selepas log masuk
Salin selepas log masuk

Sebagai alternatif, untuk mengira kiraan baris dan statistik lain bagi setiap kumpulan, pendekatan berikut boleh digunakan:

df.groupby(['col1', 'col2'])[['col3', 'col4']].agg({
    'col3': ['mean', 'count'], 
    'col4': ['median', 'min', 'count']
})
Salin selepas log masuk

Contoh Terperinci

Andaikan kita mempunyai kerangka data bernama df dengan lajur col1 hingga col4. Untuk menggambarkan, mari kita hitung kiraan baris setiap kumpulan:

df.groupby(['col1', 'col2']).size()
Salin selepas log masuk

Output akan memaparkan bilangan baris dalam setiap gabungan unik nilai col1 dan col2.

Untuk menambah kiraan ini sebagai lajur ke DataFrame kami, kami boleh menggunakan .reset_index(name='counts') kaedah:

df.groupby(['col1', 'col2']).size().reset_index(name='counts')
Salin selepas log masuk
Salin selepas log masuk

Termasuk Keputusan untuk Statistik Tambahan

Jika kita ingin mengira berbilang statistik pada data terkumpul, kita boleh menggunakan kaedah agg(). Sebagai contoh, untuk mengira min dan kiraan untuk col3 dan median, minimum dan kiraan untuk col4, kami akan menggunakan:

df.groupby(['col1', 'col2']).agg({
    'col3': ['mean', 'count'], 
    'col4': ['median', 'min', 'count']
})
Salin selepas log masuk

Ini akan mengembalikan DataFrame dengan statistik yang diminta untuk setiap gabungan unik col1 dan nilai col2.

Kesimpulan

Pandas GroupBy ialah alat yang berkuasa untuk menganalisis data berdasarkan kriteria tertentu. Dengan menggunakan kaedah dan pengagregatan yang sesuai, anda boleh mendapatkan statistik mengikut kumpulan dengan cekap untuk mendapatkan cerapan dan memahami data anda dengan lebih teliti.

Atas ialah kandungan terperinci Bagaimana untuk Mengira Statistik Bijak Kumpulan dalam Panda Menggunakan GroupBy?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:php.cn
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Artikel terbaru oleh pengarang
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan