그룹별 작업 중 추가 열 유지
pandas로 그룹별 작업을 수행할 때 특정 항목을 집계하는 동안 추가 열을 유지하는 것이 바람직한 경우가 많습니다. 열. 이를 통해 추가 조인이나 조작 없이 효율적인 데이터 조작이 가능합니다.
"otherstuff"와 같은 다른 열을 유지하면서 "diff" 열에 대해 최소값이 있는 행을 제거하려는 주어진 예를 고려하십시오. ." 기본적으로 Pandas는 min()과 같은 groupby 및 집계 함수를 사용할 때 추가 열을 삭제합니다.
이 문제를 해결하려면 두 가지 효과적인 접근 방식이 있습니다.
방법 1: idxmin 사용 ()를 사용하여 행 인덱스 식별
idxmin()은 지정된 열의 최소값을 포함하는 행의 인덱스를 반환합니다. 이 기능을 활용하면 조건에 맞는 행만 선택할 수 있습니다. 다음 코드는 이 접근 방식을 보여줍니다.
<code class="python">df.loc[df.groupby("item")["diff"].idxmin()]</code>
방법 2: 첫 번째 요소 정렬 및 선택
또 다른 방법은 "diff" 열을 기준으로 데이터 프레임을 정렬하고 각 그룹의 첫 번째 요소를 선택합니다. 이렇게 하면 다른 열을 유지하면서 최소 "diff" 값을 가진 행을 얻을 수 있습니다. 다음 코드는 이 방법을 보여줍니다.
<code class="python">df.sort_values("diff").groupby("item", as_index=False).first()</code>
두 접근 방식 모두에서 결과는 "otherstuff" 열을 유지하면서 "diff"가 최소값을 갖는 행만 포함하는 데이터 프레임입니다. 두 방법 모두 행 인덱스가 다를 수 있지만 내용은 동일합니다.
위 내용은 Pandas에서 Groupby 작업을 수행하는 동안 추가 열을 어떻게 유지할 수 있나요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!