Pandas의 크기와 개수의 구별 이해
데이터 조작 및 분석을 위한 강력한 Python 라이브러리인 Pandas는 다음과 같은 유연한 작업을 제공합니다. 카테고리별로 데이터를 그룹화합니다. 그룹화된 데이터로 작업할 때 개수와 크기 방법의 차이를 이해하는 것이 중요합니다.
질문: Pandas에서 groupby("x").count와 groupby("x").size를 구분하는 것은 무엇입니까? ? 크기는 단순히 null을 제외합니까?
답변:
개수와 크기의 차이는 NaN 값 처리에 있습니다.
예:
다음 팬더를 고려해보세요 DataFrame:
df = pd.DataFrame({'a':[0,0,1,2,2,2], 'b':[1,2,3,4,np.NaN,4], 'c':np.random.randn(6)})
'a'로 그룹화된 'b' 열의 개수 및 크기 방법 평가:
print(df.groupby(['a'])['b'].count()) print(df.groupby(['a'])['b'].size())
출력:
a 0 2 1 1 2 2 Name: b, dtype: int64 a 0 2 1 1 2 3 dtype: int64
분명히 카운트 방법은 그룹 4의 NaN 값을 제외합니다(여기서 'a'는 2) 사이즈 방법에는 포함되어 있습니다.
위 내용은 Pandas에서 `groupby().count()`와 `groupby().size()`의 차이점은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!