목록의 Pandas 열을 여러 열로 분할
데이터 탐색에서는 DataFrame 열을 보다 관리하기 쉬운 형식으로 재구성해야 하는 경우가 많습니다. 그러한 시나리오 중 하나는 목록이 포함된 열을 여러 열로 분할하는 것입니다.
팀 이름 목록이 포함된 "teams"라는 단일 열이 있는 DataFrame을 고려해 보세요.
import pandas as pd df = pd.DataFrame({ "teams": [[ "SF", "NYG" ] for _ in range(7)] })
이를 분할하려면 "teams" 열을 "team1"과 "team2"라는 두 개의 열로 나누면 to_list에서 생성된 목록과 함께 DataFrame 생성자를 활용할 수 있습니다. 방법.
옵션 1: 기존 DataFrame 수정
to_list 방법을 사용하면 "팀" 목록을 다음 작업에 사용할 수 있는 목록 목록으로 변환할 수 있습니다. 새 "team1" 및 "team2" 열을 만듭니다.
df[['team1', 'team2']] = pd.DataFrame(df['teams'].tolist(), index=df.index)
이 작업은 원본 DataFrame을 수정합니다. 새 열 사용:
teams team1 team2 0 [SF, NYG] SF NYG 1 [SF, NYG] SF NYG 2 [SF, NYG] SF NYG 3 [SF, NYG] SF NYG 4 [SF, NYG] SF NYG 5 [SF, NYG] SF NYG 6 [SF, NYG] SF NYG
옵션 2: 새 DataFrame 생성
또는 원하는 경우 분할 열을 사용하여 새 DataFrame을 생성할 수 있습니다.
df3 = pd.DataFrame( df['teams'].tolist(), columns=['team1', 'team2'] )
이 작업을 수행하면 별도의 DataFrame:
team1 team2 0 SF NYG 1 SF NYG 2 SF NYG 3 SF NYG 4 SF NYG 5 SF NYG 6 SF NYG
이 분할을 달성하기 위해 apply(pd.Series) 함수를 적용하는 것은 상당히 느리며 대규모 데이터 세트에는 권장되지 않습니다.
위 내용은 목록의 Pandas 열을 여러 열로 효율적으로 분할하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!