Pandas 데이터 그룹화 개수 및 최대 개수 검색
문제:
Pandas DataFrame 제공 여러 열을 사용하는 경우 두 개의 특정 열을 기준으로 행을 효율적으로 그룹화하고 각 그룹의 개수를 얻으려면 어떻게 해야 합니까? 또한 그룹화 열 중 하나에 있는 각 값의 최대 개수를 어떻게 결정합니까?
해결책:
DataFrame 행을 두 개의 열과 개수 발생으로 그룹화하려면 , groupby() 함수와 size() 메서드를 차례로 사용합니다.
<code class="python">df.groupby(['col5', 'col2']).size()</code>
이 작업은 지정된 열을 기반으로 그룹을 생성하고 각 그룹의 행 수를 반환합니다. 출력은 다음과 유사합니다.
col5 col2 count 1 A 1 D 3 2 B 2 ...
col2 열의 각 값에 대한 최대 개수를 찾으려면:
<code class="python">df.groupby(['col5', 'col2']).size().groupby(level=1).max()</code>
이 작업은 개수 데이터를 col2 열 수준별로 그룹화하고 각 col2 값의 최대 개수를 반환하여 다음과 같은 출력을 생성합니다.
col2 A 3 B 2 C 1 D 3
추가 참고 사항:
여러 열로 그룹화하고 개수 및 추가 요약 통계를 얻으려면 , 여러 집계 함수를 지정할 수 있는 agg()와 같은 다른 메서드와 함께 groupby()를 사용할 수 있습니다.
<code class="python">df.groupby(['col5', 'col2']).agg(['count', 'mean', 'max'])</code>
위 내용은 Pandas 데이터를 그룹화하고, 발생 횟수를 계산하고, 최대 횟수를 찾는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!