Memahami Perbezaan antara Saiz dan Kiraan dalam Panda
Panda, perpustakaan Python yang berkuasa untuk manipulasi dan analisis data, menawarkan operasi yang fleksibel seperti mengumpulkan data mengikut kategori. Apabila bekerja dengan data terkumpul, memahami perbezaan antara kaedah kiraan dan saiz adalah penting.
Soalan: Apa yang memisahkan kumpulan mengikut("x").kira dan kumpulan mengikut("x").saiz dalam Pandas ? Adakah saiz hanya mengecualikan null?
Jawapan:
Perbezaan antara kiraan dan saiz terletak pada pengendalian nilai NaN mereka:
Contoh:
Pertimbangkan Panda berikut DataFrame:
df = pd.DataFrame({'a':[0,0,1,2,2,2], 'b':[1,2,3,4,np.NaN,4], 'c':np.random.randn(6)})
Menilai kaedah kiraan dan saiz pada lajur 'b' dikumpulkan mengikut 'a':
print(df.groupby(['a'])['b'].count()) print(df.groupby(['a'])['b'].size())
Output:
a 0 2 1 1 2 2 Name: b, dtype: int64 a 0 2 1 1 2 3 dtype: int64
Seperti yang terbukti, kaedah kiraan mengecualikan nilai NaN dalam kumpulan 4 (dengan 'a' ialah 2), manakala kaedah saiz merangkuminya.
Atas ialah kandungan terperinci Apakah Perbezaan Antara `groupby().count()` dan `groupby().size()` dalam Panda?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!