DataFrame 열에서 값 빈도 찾기
데이터 분석에서는 특정 열에 있는 값의 발생 빈도를 계산해야 하는 경우가 많습니다. DataFrame의 이를 달성하기 위해 pandas는 여러 기능을 제공합니다.
일반적인 접근 방식 중 하나는 value_counts() 메서드를 사용하는 것입니다. 예를 들어 DataFrame이 있는 경우:
category | |
---|---|
cat | a |
cat | b |
cat | a |
value_counts()를 사용하면 고유한 값과 해당 빈도가 반환됩니다.
1 2 |
|
출력:
category | freq |
---|---|
cat a | 2 |
cat b | 1 |
다른 방법 groupby() 및 count() 함수를 사용하는 것입니다. 이 접근 방식은 관심 있는 열을 기준으로 DataFrame을 그룹화하고 그룹 내 각 값의 발생 횟수를 계산합니다.
1 |
|
출력:
category | count |
---|---|
cat a | 2 |
cat b | 1 |
마지막으로 빈도를 다시 원본 DataFrame의 경우, 변환() 함수를 사용하여 빈도를 포함하는 새 열을 생성할 수 있습니다.
1 |
|
이 결과는 다음 DataFrame:
category | freq | |
---|---|---|
cat | a | 2 |
cat | b | 1 |
cat | a | 2 |
이러한 방법을 활용하여 데이터 분석가는 DataFrame 열의 값 빈도를 효율적으로 분석하여 의사 결정에 귀중한 통찰력을 제공할 수 있습니다.
위 내용은 Pandas DataFrame 열의 값 빈도를 효율적으로 계산하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!