Pandas DataFrame의 열을 여러 행으로 중첩 해제하는 방법
Pandas를 사용한 데이터 조작의 과제 중 하나는 다음을 포함하는 열을 처리하는 것입니다. 기울기. 이러한 목록 유형 열을 별도의 행으로 분할해야 하는 경우 프로세스를 "중첩 해제" 또는 "폭발"이라고 합니다.
Pandas 중첩 해제 방법
방법 1: pandas.DataFrame.explode
중첩 해제할 단일 열이 있는 DataFrame의 경우 pandas.DataFrame.explode 함수를 사용할 수 있습니다. 열 이름을 인수로 사용합니다.
df.explode('B') # dataframe with column 'B' containing lists
방법 2: 반복 및 DataFrame 생성자 사용
이 방법은 반복과 DataFrame 생성자를 결합합니다. 목록의 길이에 따라 열의 값을 반복한 다음 연결합니다.
df = pd.DataFrame({'A': df.A.repeat(df.B.str.len()), 'B': np.concatenate(df.B.values)})
방법 3: 목록 다시 만들기
목록 다시 만들기 목록에는 이전 열을 열의 값과 열의 각 요소를 포함하는 튜플 목록으로 변환하는 작업이 포함됩니다. list.
pd.DataFrame([[x] + [z] for x, y in df.values for z in y], columns=df.columns)
방법 4: Reindex 사용
Reindex는 목록의 요소에 대해 반복되는 인덱스를 사용하여 새 DataFrame을 생성합니다. 그런 다음 연결된 요소가 열에 할당됩니다.
df.reindex(df.index.repeat(df.B.str.len())).assign(B=np.concatenate(df.B.values))
여러 열로 일반화
여러 열의 중첩을 해제하려면 사용자 정의 함수를 정의할 수 있습니다. 폭발하려면 DataFrame과 열 이름 목록이 필요합니다.
def unnesting(df, explode): idx = df.index.repeat(df[explode[0]].str.len()) df1 = pd.concat([ pd.DataFrame({x: np.concatenate(df[x].values)}) for x in explode], axis=1) df1.index = idx return df1.join(df.drop(explode, 1), how='left')
수평 중첩 해제
수평 중첩 해제하려면 add_prefix 메소드를 사용하여 시리즈를 생성할 수 있습니다. 새로운 열.
df.join(pd.DataFrame(df.B.tolist(), index=df.index).add_prefix('B_'))
위 내용은 Pandas DataFrame 열(또는 여러 열)을 여러 행으로 중첩 해제하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!