> 백엔드 개발 > 파이썬 튜토리얼 > Pandas DataFrame에서 연속 값을 그룹화하는 방법은 무엇입니까?

Pandas DataFrame에서 연속 값을 그룹화하는 방법은 무엇입니까?

DDD
풀어 주다: 2024-11-30 06:47:10
원래의
234명이 탐색했습니다.

How to Group Consecutive Values in a Pandas DataFrame?

Pandas DataFrame에서 연속 값 그룹화

데이터 분석에서는 데이터가 정렬되어 연속적인 값을 그룹화해야 하는 상황이 자주 발생합니다. 가치를 함께합니다. 이 작업은 사용자 정의된 그룹화 기술을 사용하여 Pandas에서 수행할 수 있습니다.

다음 값을 포함하는 'a'라는 열이 있는 DataFrame이 있다고 가정합니다.

[1, 1, -1, 1, -1, -1]
로그인 후 복사

우리의 목표는 이러한 항목을 그룹화하는 것입니다. 다음과 같이 값을 연속된 블록으로 변환합니다.

[1,1] [-1] [1] [-1, -1]
로그인 후 복사

이를 달성하려면 다음을 사용할 수 있습니다. 단계:

  1. 사용자 정의 시리즈 만들기: ne 및 Shift 기능을 사용하여 새 시리즈를 만듭니다. 이 시리즈는 현재 값이 이전 값과 다른지 여부를 나타내는 부울 값을 반환합니다.
  2. 그룹화를 위해 시리즈 사용: 사용자 정의 시리즈를 groupby 함수에 전달합니다. 이는 연속된 블록별로 데이터를 그룹화합니다.
  3. 그룹화된 데이터에 대한 반복: 그룹화된 데이터에 대해 반복하고 인덱스, 그룹화된 DataFrame 및 값 목록을 인쇄합니다. 각 그룹에 대한 'a' 열.

다음은 이를 구현하는 코드입니다. 단계:

import pandas as pd

df = pd.DataFrame({'a': [1, 1, -1, 1, -1, -1]})
print(df)

custom_series = df['a'].ne(df['a'].shift()).cumsum()
print(custom_series)

for i, g in df.groupby(custom_series):
    print(i)
    print(g)
    print(g.a.tolist())
로그인 후 복사

원하는 그룹화가 출력됩니다.

1
   a
0  1
1  1
[1, 1]
2
   a
2 -1
[-1]
3
   a
3  1
[1]
4
   a
4 -1
5 -1
[-1, -1]
로그인 후 복사

위 내용은 Pandas DataFrame에서 연속 값을 그룹화하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿