값 개수를 얻기 위해 pandas로 열 구간화
Pandas 데이터 프레임의 숫자 데이터를 처리할 때 구간화하는 것이 유용할 수 있습니다. 분석을 위해 데이터를 특정 범위로 분류합니다. 이 프로세스를 비닝이라고 합니다.
Pandas에서 열을 비닝하려면 다음 단계를 사용할 수 있습니다.
예:
'백분율'이라는 숫자 열이 있는 다음 데이터 프레임을 고려해 보세요.
import pandas as pd import numpy as np df = pd.DataFrame({'percentage': [46.5, 44.2, 100.0, 42.12]})
To '백분율' 열을 다음과 같이 분류합니다. bins:
bins = [0, 1, 5, 10, 25, 50, 100]
다음과 같이 잘라내기 기능을 사용할 수 있습니다.
df['binned'] = pd.cut(df['percentage'], bins=bins)
이렇게 하면 bin 레이블이 포함된 데이터 프레임에 'binned'라는 새 열이 생성됩니다.
각 bin 내의 값 개수를 얻으려면 value_counts를 사용할 수 있습니다. 방법:
print(df['binned'].value_counts())
출력:
(25, 50] 3 (50, 100] 1
또는 groupby를 사용하여 크기를 집계할 수 있습니다:
print(df.groupby(df['binned']).size())
출력:
percentage (0, 1] 0 (1, 5] 0 (5, 10] 0 (10, 25] 0 (25, 50] 3 (50, 100] 1 dtype: int64
각 bin 내의 값 개수를 제공합니다.
위 내용은 Pandas DataFrame에 숫자 데이터를 저장하고 각 저장소 내에서 값을 계산하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!