Pandas DataFrame에서 그룹화된 최소 작업 중 다른 열 유지
groupby 함수를 사용하여 특정 열별로 데이터를 그룹화하고 집계 작업을 수행하는 경우 최소값 찾기와 같이 DataFrame의 다른 열이 실수로 삭제될 수 있습니다.
그룹화된 열에 대해 최소 작업을 수행하는 동안 추가 열을 유지하려면 다음 방법을 고려하세요.
방법 1 : idxmin()
idxmin()을 사용하면 각 그룹 내 최소값의 인덱스를 반환합니다. 이를 활용하면 원하는 행만 선택할 수 있습니다.
<code class="python">result = df.loc[df.groupby("item")["diff"].idxmin()]</code>
방법 2: 첫 번째 요소 정렬 및 가져오기
또는 다음과 같이 데이터 프레임을 정렬할 수 있습니다. groupby 작업을 수행하고 각 그룹의 첫 번째 행을 추출하기 전에 최소 열:
<code class="python">result = df.sort_values("diff").groupby("item", as_index=False).first()</code>
두 방법 모두 최소 diff 값을 기준으로 행을 필터링하는 동안 otherstuff 열을 유지하면서 원하는 출력을 생성합니다.
item diff otherstuff 0 1 1 2 1 2 -6 2 2 3 0 0
행 내용은 동일하게 유지되지만 결과 인덱스는 두 가지 방법에 따라 다를 수 있습니다.
위 내용은 그룹화된 Pandas DataFrame에서 최소값을 찾는 동안 다른 열을 유지하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!