> 백엔드 개발 > 파이썬 튜토리얼 > Python에서 Pandas DataFrame을 어떻게 피벗할 수 있나요?

Python에서 Pandas DataFrame을 어떻게 피벗할 수 있나요?

Patricia Arquette
풀어 주다: 2024-12-26 16:33:09
원래의
207명이 탐색했습니다.

How Can I Pivot a Pandas DataFrame in Python?

데이터 프레임을 어떻게 피벗할 수 있나요?

피벗이란 무엇인가요?

피벗은 행과 열을 교환하여 DataFrame의 모양을 변경하는 데 사용되는 데이터 변환 기술입니다. 일반적으로 데이터를 더 쉽게 분석하거나 시각화할 수 있는 방식으로 구성하는 데 사용됩니다.

어떻게 피벗하나요?

DataFrame을 피벗하는 방법에는 여러 가지가 있습니다. Pandas 라이브러리를 사용하는 Python:

1. pd.DataFrame.pivot_table:

이 방법은 데이터 피벗을 위한 다양하고 기능이 풍부한 옵션입니다. 집계할 값, 집계 함수, 행 및 열 인덱스를 지정할 수 있습니다.

예:

import pandas as pd

# Create a sample DataFrame
df = pd.DataFrame({
    "row": ["row0", "row1", "row2", "row3", "row4"],
    "col": ["col0", "col1", "col2", "col3", "col4"],
    "val0": [0.81, 0.44, 0.77, 0.15, 0.81],
    "val1": [0.04, 0.07, 0.01, 0.59, 0.64]
})

# Pivot the DataFrame using pivot_table
df_pivoted = df.pivot_table(
    index="row",
    columns="col",
    values="val0",
    aggfunc="mean",
)

print(df_pivoted)

# Output:
     col0   col1   col2   col3   col4
row                                  
row0  0.77  0.445  0.000  0.860  0.650
row1  0.130  0.000  0.395  0.500  0.250
row2  0.000  0.310  0.000  0.545  0.000
row3  0.000  0.100  0.395  0.760  0.240
row4  0.000  0.000  0.000  0.000  0.000
로그인 후 복사

2. pd.DataFrame.groupby pd.DataFrame.unstack:

이 방법에는 DataFrame을 원하는 행 및 열 인덱스로 그룹화한 다음 unstack을 사용하여 그룹화된 데이터를 피벗하는 작업이 포함됩니다.

예:

# Group the DataFrame by row and col
df_grouped = df.groupby(["row", "col"])

# Perform pivot using unstack
df_pivoted = df_grouped["val0"].unstack(fill_value=0)

print(df_pivoted)

# Output:
col   col0   col1   col2   col3   col4
row                                  
row0  0.81  0.445  0.000  0.860  0.650
row1  0.130  0.000  0.395  0.500  0.250
row2  0.000  0.310  0.000  0.545  0.000
row3  0.000  0.100  0.395  0.760  0.240
row4  0.000  0.000  0.000  0.000  0.000
로그인 후 복사

3. pd.DataFrame.set_index pd.DataFrame.unstack:

이 방법에는 원하는 행 및 열 인덱스를 DataFrame의 인덱스로 설정한 다음 unstack을 사용하여 데이터를 피벗하는 작업이 포함됩니다.

예:

# Set the row and col as the DataFrame's index
df = df.set_index(["row", "col"])

# Perform pivot using unstack
df_pivoted = df["val0"].unstack(fill_value=0)

print(df_pivoted)

# Output:
col   col0   col1   col2   col3   col4
row                                  
row0  0.81  0.445  0.000  0.860  0.650
row1  0.130  0.000  0.395  0.500  0.250
row2  0.000  0.310  0.000  0.545  0.000
row3  0.000  0.100  0.395  0.760  0.240
row4  0.000  0.000  0.000  0.000  0.000
로그인 후 복사

4. pd.DataFrame.pivot:

이 방법은ivot_table에 비해 더 간단한 구문을 제공하지만 기능이 제한되어 있습니다. 행 및 열 인덱스만 지정할 수 있으며 집계는 수행할 수 없습니다.

예:

# Perform pivot using pivot
df_pivoted = df.pivot(index="row", columns="col")

print(df_pivoted)

# Output:
col   col0   col1   col2   col3   col4
row                                  
row0  key0  0.81  0.44  0.00  0.86  0.65
row1  key1  0.13  0.00  0.39  0.50  0.25
row2  key1  0.00  0.31  0.00  0.54  0.00
row3  key0  0.00  0.10  0.39  0.76  0.24
row4  key1  0.00  0.00  0.00  0.00  0.00
로그인 후 복사

긴 형식에서 와이드 형식으로

두 가지만 사용하여 DataFrame을 긴 형식에서 와이드 형식으로 변환하려면 열:

1. pd.DataFrame.pivot(index=column_to_index, columns=column_to_columns, value=values_to_pivot**):

예:

df["Combined"] = df["row"] + "|" + df["col"]
df_pivoted = df.pivot(index="Combined", columns="A", values="B")

print(df_pivoted)

# Output:
A         a     b    c
Combined
row0|col0  0.0  10.0  7.0
row1|col1  11.0  10.0  NaN
row2|col2  2.0  14.0  NaN
row3|col3  11.0   NaN  NaN
row4|col4   NaN   NaN  NaN
로그인 후 복사

2. pd.DataFrame.groupby pd.DataFrame.unstack:

df["Combined"] = df["row"] + "|" + df["col"]
df_grouped = df.groupby(["Combined", "A"])
df_pivoted = df_grouped["B"].unstack(fill_value=0)

print(df_pivoted)

# Output:
A         a     b    c
Combined
row0|col0  0.0  10.0  7.0
row1|col1  11.0  10.0  NaN
row2|col2  2.0  14.0  NaN
row3|col3  11.0   NaN  NaN
row4|col4   NaN   NaN  NaN
로그인 후 복사

피벗 후 여러 인덱스를 단일 인덱스로 평면화:

df_pivoted.columns = df_pivoted.columns.map("|".join)

print(df_pivoted)

# Output:
   a|col0  b|col0  c|col0  a|col1  b|col1  c|col1  a|col2  b|col2  c|col2  a|col3  b|col3  c|col3
row                                                                                        
row0    0.0   10.0    7.0   11.0   10.0    NaN    2.0   14.0    NaN    11.0    NaN    NaN
row1    0.0   10.0    7.0   11.0   10.0    NaN    2.0   14.0    NaN    11.0    NaN    NaN
로그인 후 복사

위 내용은 Python에서 Pandas DataFrame을 어떻게 피벗할 수 있나요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿