> 백엔드 개발 > 파이썬 튜토리얼 > 여러 열을 기반으로 Pandas DataFrame에서 각 그룹의 첫 번째 행을 검색하는 방법은 무엇입니까?

여러 열을 기반으로 Pandas DataFrame에서 각 그룹의 첫 번째 행을 검색하는 방법은 무엇입니까?

DDD
풀어 주다: 2024-11-17 09:59:03
원래의
790명이 탐색했습니다.

How to retrieve the first row of each group in a Pandas DataFrame based on multiple columns?

Pandas DataFrame에서 각 그룹의 첫 번째 행 검색

질문:

방법 그룹화가 다음과 같은 Pandas DataFrame에서 각 그룹의 첫 번째 행을 효율적으로 추출할 수 있습니까? 여러 열로 정의하시겠습니까?

답변:

여러 열을 기반으로 Pandas DataFrame에서 각 그룹의 첫 번째 행을 검색하려면:

  1. 데이터 그룹화: 다음을 사용하여 원하는 열별로 DataFrame을 그룹화합니다. groupby() 메서드:

    df_grouped = df.groupby(['id', 'value'])
    로그인 후 복사
  2. 집계 함수 적용: 각 그룹에 first() 함수를 적용하여 null이 아닌 첫 번째 요소를 얻습니다.

    df_first_rows = df_grouped.first()
    로그인 후 복사
  3. 색인 재설정 (선택 사항): 'id' 및 'value' 열이 별도의 열로 필요한 경우, Reset_index() 메서드를 사용하세요.

    df_first_rows = df_first_rows.reset_index()
    로그인 후 복사

예:

다음 사항을 고려하세요. DataFrame:

df = pd.DataFrame({'id': [1, 1, 1, 2, 2, 3, 3, 3, 3, 4, 4, 5, 6, 6, 6, 7, 7],
                   'value': ["first", "second", "second", "first",
                             "second", "first", "third", "fourth",
                             "fifth", "second", "fifth", "first",
                             "first", "second", "third", "fourth", "fifth"]})
로그인 후 복사

上記の 단계 적용:

df_grouped = df.groupby(['id', 'value'])
df_first_rows = df_grouped.first()
df_first_rows = df_first_rows.reset_index()

print(df_first_rows)
로그인 후 복사

출력:

   id   value
0   1   first
1   2   first
2   3   first
3   4   second
4   5   first
5   6   first
6   7   fourth
로그인 후 복사

이 코드는 첫 번째 행을 성공적으로 검색합니다. 'id' 및 'value' 열로 정의된 각 그룹의

위 내용은 여러 열을 기반으로 Pandas DataFrame에서 각 그룹의 첫 번째 행을 검색하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿