> 백엔드 개발 > 파이썬 튜토리얼 > Pandas DataFrame에서 동일한 행의 빈도를 계산하는 방법은 무엇입니까?

Pandas DataFrame에서 동일한 행의 빈도를 계산하는 방법은 무엇입니까?

Barbara Streisand
풀어 주다: 2024-10-25 08:01:02
원래의
565명이 탐색했습니다.

How to Count the Frequency of Identical Rows in a Pandas DataFrame?

여러 데이터프레임 열을 기반으로 빈도 수 가져오기

동일한 행이 데이터프레임에 얼마나 자주 나타나는지 확인하려면 Pandas의 groupby를 사용할 수 있습니다. 기능. 다음 예를 고려하십시오.

data = {'Group': ['Short', 'Short', 'Moderate', 'Moderate', 'Tall'], 'Size': ['Small', 'Small', 'Medium', 'Small', 'Large']}
df = pd.DataFrame(data)
로그인 후 복사

세 가지 방법으로 빈도 수를 계산할 수 있습니다.

옵션 1:

dfg = df.groupby(by=["Group", "Size"]).size()
로그인 후 복사

이것은 다음 출력이 포함된 시리즈:

Group     Size
Moderate  Medium    1
          Small     1
Short     Small     2
Tall      Large     1
dtype: int64
로그인 후 복사

옵션 2:

dfg = df.groupby(by=["Group", "Size"]).size().reset_index(name="Time")
로그인 후 복사

이렇게 하면 "시간" 열이 추가된 DataFrame이 생성됩니다.

      Group    Size  Time
0  Moderate  Medium     1
1  Moderate   Small     1
2     Short   Small     2
3      Tall   Large     1
로그인 후 복사

옵션 3:

dfg = df.groupby(by=["Group", "Size"], as_index=False).size()
로그인 후 복사

옵션 2의 출력과 동일한 DataFrame도 생성됩니다.

위 내용은 Pandas DataFrame에서 동일한 행의 빈도를 계산하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿