Memahami Perbezaan antara Saiz dan Kiraan dalam Panda
Manipulasi data selalunya melibatkan penggunaan fungsi kumpulan Pandas untuk mengagregat data berdasarkan kriteria tertentu. Dua fungsi pengagregatan yang biasa digunakan, kiraan dan saiz, memberikan cerapan berbeza tentang data terkumpul.
kumpulan mengikut("x").kira lwn kumpulan mengikut("x").saiz
Perbezaan asas antara kiraan dan saiz terletak pada perlakuan mereka terhadap nilai yang hilang. count mengira bilangan nilai bukan nol dalam kumpulan, tidak termasuk sebarang nilai yang hilang (cth., NaN atau Tiada). Sebaliknya, saiz mengira jumlah bilangan pemerhatian dalam kumpulan, tidak kira sama ada ia mengandungi nilai yang hilang.
Contoh
Pertimbangkan DataFrame berikut:
df = pd.DataFrame({'a':[0,0,1,2,2,2], 'b':[1,2,3,4,np.NaN,4], 'c':np.random.randn(6)})
Menggunakan kiraan dan saiz, kita boleh memerhati berikut:
df.groupby(['a'])['b'].count() # Output: # a # 0 2 # 1 1 # 2 2 # Name: b, dtype: int64 df.groupby(['a'])['b'].size() # Output: # a # 0 2 # 1 1 # 2 3 # dtype: int64
Seperti yang anda lihat, kiraan tidak termasuk nilai yang hilang dalam kumpulan 2, menghasilkan kiraan 2 untuk kumpulan itu. Sebaliknya, saiz termasuk nilai yang hilang, menghasilkan jumlah kiraan 3. Perbezaan ini menyerlahkan kepentingan memahami gelagat fungsi ini apabila berurusan dengan data yang hilang.
Atas ialah kandungan terperinci Pandas GroupBy: Bila Menggunakan `count()` vs. `size()`?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!