> 백엔드 개발 > 파이썬 튜토리얼 > 목록의 Pandas 열을 여러 열로 효율적으로 분할하는 방법은 무엇입니까?

목록의 Pandas 열을 여러 열로 효율적으로 분할하는 방법은 무엇입니까?

Mary-Kate Olsen
풀어 주다: 2024-12-17 13:02:26
원래의
723명이 탐색했습니다.

How to Efficiently Split a Pandas Column of Lists into Multiple Columns?

목록의 Pandas 열을 여러 열로 분할

데이터 탐색에서는 DataFrame 열을 보다 관리하기 쉬운 형식으로 재구성해야 하는 경우가 많습니다. 그러한 시나리오 중 하나는 목록이 포함된 열을 여러 열로 분할하는 것입니다.

팀 이름 목록이 포함된 "teams"라는 단일 열이 있는 DataFrame을 고려해 보세요.

import pandas as pd

df = pd.DataFrame({
    "teams": [[
        "SF", 
        "NYG"
    ] for _ in range(7)]
})
로그인 후 복사

이를 분할하려면 "teams" 열을 "team1"과 "team2"라는 두 개의 열로 나누면 to_list에서 생성된 목록과 함께 DataFrame 생성자를 활용할 수 있습니다. 방법.

옵션 1: 기존 DataFrame 수정

to_list 방법을 사용하면 "팀" 목록을 다음 작업에 사용할 수 있는 목록 목록으로 변환할 수 있습니다. 새 "team1" 및 "team2" 열을 만듭니다.

df[['team1', 'team2']] = pd.DataFrame(df['teams'].tolist(), index=df.index)
로그인 후 복사

이 작업은 원본 DataFrame을 수정합니다. 새 열 사용:

       teams team1 team2
0  [SF, NYG]    SF   NYG
1  [SF, NYG]    SF   NYG
2  [SF, NYG]    SF   NYG
3  [SF, NYG]    SF   NYG
4  [SF, NYG]    SF   NYG
5  [SF, NYG]    SF   NYG
6  [SF, NYG]    SF   NYG
로그인 후 복사

옵션 2: 새 DataFrame 생성

또는 원하는 경우 분할 열을 사용하여 새 DataFrame을 생성할 수 있습니다.

df3 = pd.DataFrame(
    df['teams'].tolist(), 
    columns=['team1', 'team2']
)
로그인 후 복사

이 작업을 수행하면 별도의 DataFrame:

  team1 team2
0    SF   NYG
1    SF   NYG
2    SF   NYG
3    SF   NYG
4    SF   NYG
5    SF   NYG
6    SF   NYG
로그인 후 복사

이 분할을 달성하기 위해 apply(pd.Series) 함수를 적용하는 것은 상당히 느리며 대규모 데이터 세트에는 권장되지 않습니다.

위 내용은 목록의 Pandas 열을 여러 열로 효율적으로 분할하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿