> 백엔드 개발 > 파이썬 튜토리얼 > Pandas DataFrame의 각 그룹에서 상위 레코드를 효율적으로 가져오려면 어떻게 해야 합니까?

Pandas DataFrame의 각 그룹에서 상위 레코드를 효율적으로 가져오려면 어떻게 해야 합니까?

Barbara Streisand
풀어 주다: 2024-11-25 18:03:10
원래의
737명이 탐색했습니다.

How Can I Efficiently Get the Top Records from Each Group in a Pandas DataFrame?

Pandas: 그룹 내에서 효율적으로 최상위 레코드 얻기

Pandas DataFrames로 작업할 때 각 그룹에서 주요 레코드를 추출해야 하는 경우가 많습니다. . 일반적인 접근 방식은 'groupby' 및 'apply' 기능을 활용하여 각 그룹 내의 레코드를 열거하는 것입니다.

dfN = df.groupby('id').apply(lambda x:x['value'].reset_index()).reset_index()
로그인 후 복사

그러나 보다 간소화된 접근 방식이 있습니다:

df.groupby('id').head(2)
로그인 후 복사

이것은 메서드는 중간 계산 없이 최상위 레코드를 직접 가져옵니다. 또한 생성된 DataFrame은 원래 인덱스를 유지합니다.

결과 MultiIndex를 평면화하려면 다음을 사용하세요.

df.groupby('id').head(2).reset_index(drop=True)
로그인 후 복사

이렇게 하면 다음 DataFrame이 생성됩니다.

id value
1 1
1 2
2 1
2 2
3 1
4 1

또는 , SQL의 "row_number()" 창 함수를 사용하여 그룹 내의 레코드를 효율적으로 열거할 수 있습니다. 하지만 이 기능은 현재 Pandas에서 사용할 수 없습니다.

위 내용은 Pandas DataFrame의 각 그룹에서 상위 레코드를 효율적으로 가져오려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿