개요:
Pandas에서 , groupby() 메서드는 특정 열로 그룹화된 데이터를 조작하기 위한 두 가지 옵션을 제공합니다. 적용() 및 변환(). 이러한 방법은 입력, 출력 및 동작 측면에서 다릅니다.
주요 차이점:
기능 | 적용 | 변형 | ||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
각 그룹의 모든 열을 포함하는 DataFrame을 전달 | 각 그룹의 각 열에 대해 개별 시리즈를 전달합니다. group | ||||||||||||
출력: | 스칼라, 시리즈, DataFrames 또는 기타 객체를 반환할 수 있음 | 반환해야 함 동일한 길이의 시퀀스(시리즈, 배열 또는 목록) 그룹 | ||||||||||||
동작: |
각 그룹 내의 전체 DataFrame에서 작동 | 단일 열에서 작동 한 번에 |
각 그룹 내의 전체 DataFrame에 사용자 지정 함수를 적용해야 하는 경우.이를 통해 복잡한 행 단위 처리가 가능하고 동일한 DataFrame이 반환됩니다. 행 수 입력.
df.groupby('State').apply(lambda x: pd.DataFrame({'Average': x.mean()}))
예:
각 내에서 열별로 사용자 정의 함수를 적용해야 합니다. group.이를 사용하면 전체 DataFrame에 영향을 주지 않고 특정 열을 조작할 수 있습니다.
df.groupby('State').transform(lambda x: x - x.mean())
예:
위 내용은 적용과 변환: 언제 Pandas Groupby에서 어느 것을 사용해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!