Pandas DataFrame에서 연속 값 그룹화
데이터 분석에서는 데이터가 정렬되어 연속적인 값을 그룹화해야 하는 상황이 자주 발생합니다. 가치를 함께합니다. 이 작업은 사용자 정의된 그룹화 기술을 사용하여 Pandas에서 수행할 수 있습니다.
다음 값을 포함하는 'a'라는 열이 있는 DataFrame이 있다고 가정합니다.
[1, 1, -1, 1, -1, -1]
우리의 목표는 이러한 항목을 그룹화하는 것입니다. 다음과 같이 값을 연속된 블록으로 변환합니다.
[1,1] [-1] [1] [-1, -1]
이를 달성하려면 다음을 사용할 수 있습니다. 단계:
다음은 이를 구현하는 코드입니다. 단계:
import pandas as pd df = pd.DataFrame({'a': [1, 1, -1, 1, -1, -1]}) print(df) custom_series = df['a'].ne(df['a'].shift()).cumsum() print(custom_series) for i, g in df.groupby(custom_series): print(i) print(g) print(g.a.tolist())
원하는 그룹화가 출력됩니다.
1 a 0 1 1 1 [1, 1] 2 a 2 -1 [-1] 3 a 3 1 [1] 4 a 4 -1 5 -1 [-1, -1]
위 내용은 Pandas DataFrame에서 연속 값을 그룹화하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!