Groupby 데이터 프레임을 df.groupby().transform()과 결합
Pandas 데이터 프레임을 처리할 때 다음 작업을 수행해야 하는 경우가 많습니다. 값 그룹화 및 통계 계산과 같은 데이터의 하위 집합입니다. 그러나 이러한 작업의 결과를 원래 데이터 프레임에 다시 결합하는 것은 번거로울 수 있습니다.
이 문제를 해결하려면 다음 시나리오를 고려하십시오.
문제: 'c'와 'type'이라는 두 개의 열이 있는 데이터프레임이 있습니다. 목표는 각 'c'에 대한 'type' 값을 세고 'c' 크기의 열을 데이터프레임에 추가하는 것입니다.
접근 방법 1(Map 사용):
한 가지 접근 방식은 시리즈의 각 값에 함수를 적용하는 map() 함수를 사용하는 것입니다. 이 경우 'c'의 크기를 데이터 프레임의 해당 'c' 값에 매핑할 수 있습니다.
<code class="python">g = df.groupby('c')['type'].value_counts().reset_index(name='t') a = df.groupby('c').size().reset_index(name='size') a.index = a['c'] g['size'] = g['c'].map(a['size'])</code>
이 접근 방식은 효과적이지만 여러 단계와 수동 인덱스 정렬이 필요합니다.
접근법 2(변환 사용):
더 간단한 해결책은 데이터 프레임의 각 행에 함수를 적용하고 다음에 정렬된 시리즈를 반환하는 pandas의 변환() 함수를 사용하는 것입니다. 원래 인덱스. 변환을 사용하여 'c' 크기를 데이터프레임에 직접 추가할 수 있습니다.
<code class="python">g = df.groupby('c')['type'].value_counts().reset_index(name='t') g['size'] = df.groupby('c')['type'].transform('size')</code>
이 접근 방식을 사용하면 별도의 크기 계산 및 인덱스 정렬이 필요하지 않으므로 더욱 간결하고 효율적인 솔루션이 됩니다.
위 내용은 df.groupby().transform()을 사용하여 그룹화된 데이터프레임을 효과적으로 결합하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!