> 백엔드 개발 > 파이썬 튜토리얼 > Pandas DataFrame의 공통 열 값을 기반으로 행 수를 계산하는 방법은 무엇입니까?

Pandas DataFrame의 공통 열 값을 기반으로 행 수를 계산하는 방법은 무엇입니까?

DDD
풀어 주다: 2024-10-26 08:01:02
원래의
658명이 탐색했습니다.

How to Count Rows Based on Common Column Values in a Pandas DataFrame?

데이터 프레임의 공통 열 값을 기준으로 행 계산

많은 데이터 세트에는 특정 열에 대해 동일한 값을 가진 중복 행이 포함되어 있습니다. 이러한 발생 빈도를 분석하기 위해 DataFrame 그룹화 기술을 사용할 수 있습니다.

"Group" 및 "Size" 열로 구성된 DataFrame을 생각해 보세요.

Group Size Time
Short Small 2
Moderate Medium 1
Moderate Small 1
Tall Large 1

GroupBy 및 Size

pandas groupby 기능을 사용하면 지정된 열을 기준으로 행을 그룹화할 수 있습니다. 크기 함수는 각 그룹 내의 행 수를 계산하는 편리한 방법을 제공합니다.

<code class="python">import pandas as pd

# Load the sample data
data = {'Group': ['Short', 'Short', 'Moderate', 'Moderate', 'Tall'], 'Size': ['Small', 'Small', 'Medium', 'Small', 'Large']}
df = pd.DataFrame(data)

# Group by "Group" and "Size" columns
dfg = df.groupby(by=["Group", "Size"]).size()</code>
로그인 후 복사

이 작업은 다음 출력과 함께 시리즈를 반환합니다.

Group     Size
Moderate  Medium    1
          Small     1
Short     Small     2
Tall      Large     1
dtype: int64
로그인 후 복사

재설정 인덱스 및 선택성

시리즈를 개수 열이 있는 DataFrame으로 변환하려면 Reset_index를 사용하고 새 열의 이름을 지정할 수 있습니다.

<code class="python">dfg = df.groupby(by=["Group", "Size"]).size().reset_index(name="Time")</code>
로그인 후 복사

추가로, 특정 요구 사항에 따라 as_index 매개변수와 함께 groupby 함수의 변형을 사용할 수 있습니다.

<code class="python"># Option 1: Explicitly set index to True
dfg = df.groupby(by=["Group", "Size"], as_index=True).size()

# Option 2: Leave index unchanged (default)
dfg = df.groupby(by=["Group", "Size"]).size()

# Option 3: Explicitly set index to False
dfg = df.groupby(by=["Group", "Size"], as_index=False).size()</code>
로그인 후 복사

위 내용은 Pandas DataFrame의 공통 열 값을 기반으로 행 수를 계산하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿