Apabila bekerja dengan data, selalunya berguna untuk dapat meringkaskan dan menganalisis data berdasarkan spesifik kriteria pengelompokan. Pandas, perpustakaan Python yang berkuasa untuk manipulasi dan analisis data, menyediakan cara yang mudah untuk melakukan ini melalui fungsi GroupBy.
Untuk mendapatkan kiraan baris dalam setiap kumpulan, gunakan saiz .size () kaedah, yang mengembalikan Siri:
df.groupby(['col1','col2']).size()
Untuk menukar ini kepada borang DataFrame, menggunakan:
df.groupby(['col1', 'col2']).size().reset_index(name='counts')
Sebagai alternatif, untuk mengira kiraan baris dan statistik lain bagi setiap kumpulan, pendekatan berikut boleh digunakan:
df.groupby(['col1', 'col2'])[['col3', 'col4']].agg({ 'col3': ['mean', 'count'], 'col4': ['median', 'min', 'count'] })
Andaikan kita mempunyai kerangka data bernama df dengan lajur col1 hingga col4. Untuk menggambarkan, mari kita hitung kiraan baris setiap kumpulan:
df.groupby(['col1', 'col2']).size()
Output akan memaparkan bilangan baris dalam setiap gabungan unik nilai col1 dan col2.
Untuk menambah kiraan ini sebagai lajur ke DataFrame kami, kami boleh menggunakan .reset_index(name='counts') kaedah:
df.groupby(['col1', 'col2']).size().reset_index(name='counts')
Jika kita ingin mengira berbilang statistik pada data terkumpul, kita boleh menggunakan kaedah agg(). Sebagai contoh, untuk mengira min dan kiraan untuk col3 dan median, minimum dan kiraan untuk col4, kami akan menggunakan:
df.groupby(['col1', 'col2']).agg({ 'col3': ['mean', 'count'], 'col4': ['median', 'min', 'count'] })
Ini akan mengembalikan DataFrame dengan statistik yang diminta untuk setiap gabungan unik col1 dan nilai col2.
Pandas GroupBy ialah alat yang berkuasa untuk menganalisis data berdasarkan kriteria tertentu. Dengan menggunakan kaedah dan pengagregatan yang sesuai, anda boleh mendapatkan statistik mengikut kumpulan dengan cekap untuk mendapatkan cerapan dan memahami data anda dengan lebih teliti.
Atas ialah kandungan terperinci Bagaimana untuk Mengira Statistik Bijak Kumpulan dalam Panda Menggunakan GroupBy?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!