Pandas에서 Groupby 작업을 수행하는 동안 추가 열을 어떻게 유지할 수 있나요?

Barbara Streisand
풀어 주다: 2024-10-25 06:13:29
원래의
488명이 탐색했습니다.

How Can I Keep Additional Columns While Performing Groupby Operations in Pandas?

그룹별 작업 중 추가 열 유지

pandas로 그룹별 작업을 수행할 때 특정 항목을 집계하는 동안 추가 열을 유지하는 것이 바람직한 경우가 많습니다. 열. 이를 통해 추가 조인이나 조작 없이 효율적인 데이터 조작이 가능합니다.

"otherstuff"와 같은 다른 열을 유지하면서 "diff" 열에 대해 최소값이 있는 행을 제거하려는 주어진 예를 고려하십시오. ." 기본적으로 Pandas는 min()과 같은 groupby 및 집계 함수를 사용할 때 추가 열을 삭제합니다.

이 문제를 해결하려면 두 가지 효과적인 접근 방식이 있습니다.

방법 1: idxmin 사용 ()를 사용하여 행 인덱스 식별

idxmin()은 지정된 열의 최소값을 포함하는 행의 인덱스를 반환합니다. 이 기능을 활용하면 조건에 맞는 행만 선택할 수 있습니다. 다음 코드는 이 접근 방식을 보여줍니다.

<code class="python">df.loc[df.groupby("item")["diff"].idxmin()]</code>
로그인 후 복사

방법 2: 첫 번째 요소 정렬 및 선택

또 다른 방법은 "diff" 열을 기준으로 데이터 프레임을 정렬하고 각 그룹의 첫 번째 요소를 선택합니다. 이렇게 하면 다른 열을 유지하면서 최소 "diff" 값을 가진 행을 얻을 수 있습니다. 다음 코드는 이 방법을 보여줍니다.

<code class="python">df.sort_values("diff").groupby("item", as_index=False).first()</code>
로그인 후 복사

두 접근 방식 모두에서 결과는 "otherstuff" 열을 유지하면서 "diff"가 최소값을 갖는 행만 포함하는 데이터 프레임입니다. 두 방법 모두 행 인덱스가 다를 수 있지만 내용은 동일합니다.

위 내용은 Pandas에서 Groupby 작업을 수행하는 동안 추가 열을 어떻게 유지할 수 있나요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿