> 백엔드 개발 > 파이썬 튜토리얼 > Pandas DataFrame의 쉼표로 구분된 문자열을 어떻게 별도의 행으로 분할할 수 있나요?

Pandas DataFrame의 쉼표로 구분된 문자열을 어떻게 별도의 행으로 분할할 수 있나요?

Mary-Kate Olsen
풀어 주다: 2025-01-01 02:21:08
원래의
340명이 탐색했습니다.

How Can I Split Comma-Separated Strings in a Pandas DataFrame into Separate Rows?

쉼표로 구분된 Pandas 데이터 프레임 문자열을 별도의 행으로 분할

Pandas 데이터 프레임에서는 하나 이상의 열에 쉼표가 포함되어 있는 경우가 종종 있습니다. 개별 행으로 분할해야 하는 구분된 값(CSV)입니다. 이를 달성하기 위해 여러 접근 방식을 사용할 수 있습니다.

Series.explode() 또는 DataFrame.explode() 사용:

이 방법은 Pandas 0.25.0에서 사용할 수 있습니다. 이상이며 목록과 같은 폭발을 위해 특별히 설계되었습니다. columns.

df.explode('column_name')
로그인 후 복사

벡터화된 함수 사용:

여러 일반 열과 여러 목록 열이 관련된 상황의 경우 벡터화된 함수가 더욱 다양한 솔루션을 제공할 수 있습니다.

def explode(df, lst_cols, fill_value='', preserve_index=False):
    # ... (implementation details)
로그인 후 복사

CSV 문자열을 다음으로 변환 목록:

CSV 문자열을 목록으로 변환하는 것만이 목표라면 str.split()을 사용하여 문자열을 분할하면 됩니다.

df['var1'] = df['var1'].str.split(',')
로그인 후 복사

사용자 정의 벡터화 접근 방식:

이 접근 방식은 일반 열과 목록을 모두 포함하여 여러 열을 처리할 수 있습니다. columns.

exploded_df = pd.DataFrame({
    col: np.repeat(x[col].values, x[lst_col].str.len())
    for col in x.columns.difference([lst_col])
}).assign(**{lst_col: np.concatenate(x[lst_col].values)})[x.columns.tolist()]
로그인 후 복사

레거시 솔루션:

이전 방법에서는 .set_index(), .str.split(), .stack() 및 . Reset_index()를 사용하여 CSV 문자열을 분할하고 개별 행으로 쌓습니다.

이러한 접근 방식은 다양한 옵션을 제공합니다. 특정 요구 사항 및 성능 고려 사항을 충족하기 위해 Pandas 데이터 프레임에서 쉼표로 구분된 문자열을 분할하는 데 사용됩니다.

위 내용은 Pandas DataFrame의 쉼표로 구분된 문자열을 어떻게 별도의 행으로 분할할 수 있나요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿