Diberikan DataFrame yang mengandungi lajur untuk ID (id), kumpulan (kumpulan ), dan istilah (istilah), matlamatnya adalah untuk mengira kejadian setiap istilah dengan cekap untuk setiap gabungan unik ID dan kumpulan.
Menggunakan fungsi kumpulan mengikut saiz dan saiz Pandas, kita boleh mencapainya tanpa perlu menggunakan gelung:
df.groupby(['id', 'group', 'term']).size().unstack(fill_value=0)
Ini operasi menghasilkan MultiIndex DataFrame hierarki yang membentangkan istilah kiraan:
term
kumpulan penggal1 penggal2 penggal3
id
1 3 2 0
2 2 1 1
Walaupun untuk set data besar dengan berjuta-juta baris, pendekatan vektor ini menunjukkan prestasi yang luar biasa:
1,000,000 rows ---------------- Elapsed time: 1.2 seconds
Atas ialah kandungan terperinci Bagaimana untuk Mengira Kejadian Penggal mengikut ID dan Kumpulan dengan Cekap dalam Pandas?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!