> 백엔드 개발 > 파이썬 튜토리얼 > Pandas DataFrame 열(또는 여러 열)을 여러 행으로 중첩 해제하는 방법은 무엇입니까?

Pandas DataFrame 열(또는 여러 열)을 여러 행으로 중첩 해제하는 방법은 무엇입니까?

DDD
풀어 주다: 2024-12-29 00:39:11
원래의
309명이 탐색했습니다.

How to Unnest a Pandas DataFrame Column (or Multiple Columns) into Multiple Rows?

Pandas DataFrame의 열을 여러 행으로 중첩 해제하는 방법

Pandas를 사용한 데이터 조작의 과제 중 하나는 다음을 포함하는 열을 처리하는 것입니다. 기울기. 이러한 목록 유형 열을 별도의 행으로 분할해야 하는 경우 프로세스를 "중첩 해제" 또는 "폭발"이라고 합니다.

Pandas 중첩 해제 방법

방법 1: pandas.DataFrame.explode

중첩 해제할 단일 열이 있는 DataFrame의 경우 pandas.DataFrame.explode 함수를 사용할 수 있습니다. 열 이름을 인수로 사용합니다.

df.explode('B')  # dataframe with column 'B' containing lists
로그인 후 복사

방법 2: 반복 및 DataFrame 생성자 사용

이 방법은 반복과 DataFrame 생성자를 결합합니다. 목록의 길이에 따라 열의 값을 반복한 다음 연결합니다.

df = pd.DataFrame({'A': df.A.repeat(df.B.str.len()), 'B': np.concatenate(df.B.values)})
로그인 후 복사

방법 3: 목록 다시 만들기

목록 다시 만들기 목록에는 이전 열을 열의 값과 열의 각 요소를 포함하는 튜플 목록으로 변환하는 작업이 포함됩니다. list.

pd.DataFrame([[x] + [z] for x, y in df.values for z in y], columns=df.columns)
로그인 후 복사

방법 4: Reindex 사용

Reindex는 목록의 요소에 대해 반복되는 인덱스를 사용하여 새 DataFrame을 생성합니다. 그런 다음 연결된 요소가 열에 할당됩니다.

df.reindex(df.index.repeat(df.B.str.len())).assign(B=np.concatenate(df.B.values))
로그인 후 복사

여러 열로 일반화

여러 열의 중첩을 해제하려면 사용자 정의 함수를 정의할 수 있습니다. 폭발하려면 DataFrame과 열 이름 목록이 필요합니다.

def unnesting(df, explode):
    idx = df.index.repeat(df[explode[0]].str.len())
    df1 = pd.concat([
        pd.DataFrame({x: np.concatenate(df[x].values)}) for x in explode], axis=1)
    df1.index = idx
    return df1.join(df.drop(explode, 1), how='left')
로그인 후 복사

수평 중첩 해제

수평 중첩 해제하려면 add_prefix 메소드를 사용하여 시리즈를 생성할 수 있습니다. 새로운 열.

df.join(pd.DataFrame(df.B.tolist(), index=df.index).add_prefix('B_'))
로그인 후 복사

위 내용은 Pandas DataFrame 열(또는 여러 열)을 여러 행으로 중첩 해제하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿