Pandas의 집계 계산을 위한 GroupBy 이해
대규모 데이터 세트로 작업할 때 Pandas는 데이터를 그룹화하는 groupby()라는 강력한 기능을 제공합니다. 특정 열을 선택하고 그룹화된 데이터에 대해 계산을 수행합니다. 이러한 맥락에서 groupby()를 활용하여 그룹 내 값의 합계를 계산하는 방법을 살펴보겠습니다.
여러 날짜에 걸쳐 개인의 과일 구매에 대한 세부 정보가 있는 다음 데이터 프레임을 고려하세요.
| Fruit | Date | Name | Number | |---|---|---|---| | Apples | 10/6/2016 | Bob | 7 | | Apples | 10/6/2016 | Bob | 8 | | Apples | 10/6/2016 | Mike | 9 | | Apples | 10/7/2016 | Steve | 10 | | Apples | 10/7/2016 | Bob | 1 | | Oranges | 10/7/2016 | Bob | 2 | | Oranges | 10/6/2016 | Tom | 15 | | Oranges | 10/6/2016 | Mike | 57 | | Oranges | 10/6/2016 | Bob | 65 | | Oranges | 10/7/2016 | Tony | 1 | | Grapes | 10/7/2016 | Bob | 1 | | Grapes | 10/7/2016 | Tom | 87 | | Grapes | 10/7/2016 | Bob | 22 | | Grapes | 10/7/2016 | Bob | 12 | | Grapes | 10/7/2016 | Tony | 15 |
목표: 그룹별 과일 구매 합계 계산 이름
과일(Fruit)과 사람의 이름(Name)을 기준으로 데이터를 그룹화하여 개인이 구매한 총 과일 개수를 계산하는 것을 목표로 합니다.
해결책: GroupBy.sum() 사용
이를 달성하기 위해 다음과 같은 groupby() 함수를 사용합니다. 그룹화할 열:
result = df.groupby(['Fruit', 'Name']).sum()
그룹화된 데이터에 적용된 sum() 메소드는 지정된 열의 값을 자동으로 집계합니다(이 경우 숫자는 구매한 과일 수를 나타냅니다).
출력:
코드의 출력은 우리에게 집계된 결과를 제공합니다. 값:
| | Number | |----------------|--------| | Fruit | Name | | Apples | Bob | 16 | | | Mike | 9 | | | Steve | 10 | | Grapes | Bob | 35 | | | Tom | 87 | | | Tony | 15 | | Oranges | Bob | 67 | | | Mike | 57 | | | Tom | 15 | | | Tony | 1 |
여기서 각 과일 카테고리 내 개인이 구매한 총 과일 수를 관찰할 수 있습니다. 예를 들어 '밥' 그룹에서는 '사과'를 총 16개, '포도'를 총 35개 구매했습니다.
위 내용은 Pandas의 `groupby()` 함수는 어떻게 그룹 내 값의 합계를 계산할 수 있나요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!