Rumah > pembangunan bahagian belakang > Tutorial Python > Bagaimana untuk Mengira Kejadian Penggal mengikut ID dan Kumpulan dengan Cekap dalam Pandas?

Bagaimana untuk Mengira Kejadian Penggal mengikut ID dan Kumpulan dengan Cekap dalam Pandas?

Barbara Streisand
Lepaskan: 2024-12-25 19:27:14
asal
894 orang telah melayarinya

How to Efficiently Count Term Occurrences by ID and Group in Pandas?

Mengambil Kiraan Tempoh mengikut ID dan Kumpulan dengan Kumpulan Pandas

Masalah

Diberikan DataFrame yang mengandungi lajur untuk ID (id), kumpulan (kumpulan ), dan istilah (istilah), matlamatnya adalah untuk mengira kejadian setiap istilah dengan cekap untuk setiap gabungan unik ID dan kumpulan.

Penyelesaian

Menggunakan fungsi kumpulan mengikut saiz dan saiz Pandas, kita boleh mencapainya tanpa perlu menggunakan gelung:

df.groupby(['id', 'group', 'term']).size().unstack(fill_value=0)
Salin selepas log masuk

Hasil

Ini operasi menghasilkan MultiIndex DataFrame hierarki yang membentangkan istilah kiraan:

         term
Salin selepas log masuk

kumpulan penggal1 penggal2 penggal3
id
1 3 2 0
2 2 1 1

Prestasi Analisis

Walaupun untuk set data besar dengan berjuta-juta baris, pendekatan vektor ini menunjukkan prestasi yang luar biasa:

1,000,000 rows
----------------
Elapsed time: 1.2 seconds
Salin selepas log masuk

Atas ialah kandungan terperinci Bagaimana untuk Mengira Kejadian Penggal mengikut ID dan Kumpulan dengan Cekap dalam Pandas?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:php.cn
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Artikel terbaru oleh pengarang
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan