변수와 날짜를 나타내는 값을 사용하여 넓은 Pandas DataFrame을 긴 형식으로 어떻게 변환합니까?

Susan Sarandon
풀어 주다: 2024-11-14 11:17:02
원래의
181명이 탐색했습니다.

How do you transform a wide Pandas DataFrame into a long format with values representing variables and dates?

Reshaping from Wide Data:

In the realm of data manipulation, reshaping a wide dataset into a long one is a crucial operation for data integration and analysis. Consider the following scenario:

You have a dataframe in pandas with daily values for variables AA, BB, and CC, indexed by dates.

+---------+----+----+----+
| date     | AA | BB | CC |
+---------+----+----+----+
| 05/03    | 1  | 2  | 3  |
| 06/03    | 4  | 5  | 6  |
| 07/03    | 7  | 8  | 9  |
| 08/03    | 5  | 7  | 1  |
+---------+----+----+----+
로그인 후 복사

You wish to transform this data into a format where each row represents a variable and date, as seen below:

+------+---------+--------+
| var  | date    | value  |
+------+---------+--------+
| AA   | 05/03   | 1      |
| AA   | 06/03   | 4      |
| AA   | 07/03   | 7      |
| AA   | 08/03   | 5      |
| BB   | 05/03   | 2      |
| BB   | 06/03   | 5      |
| BB   | 07/03   | 8      |
| BB   | 08/03   | 7      |
| CC   | 05/03   | 3      |
| CC   | 06/03   | 6      |
| CC   | 07/03   | 9      |
| CC   | 08/03   | 1      |
+------+---------+--------+
로그인 후 복사

This restructuring is a typical task in data integration and will enable you to merge this dataframe with another with matching dates and initial column names (AA, BB, CC).

Method: Pandas' Melt Function

Fortunately, pandas offers a straightforward method to perform this transformation: pandas.melt or DataFrame.melt. Here's an example:

import pandas as pd

df = pd.DataFrame({
    'date' : ['05/03', '06/03', '07/03', '08/03'],
    'AA' : [1, 4, 7, 5],
    'BB' : [2, 5, 8, 7],
    'CC' : [3, 6, 9, 1]
})
df.set_index('date', inplace=True)

dfm = df.reset_index().melt(id_vars='date')
로그인 후 복사

This will transform your dataframe into the desired long format:

     date variable  value
0   05/03       AA      1
1   06/03       AA      4
2   07/03       AA      7
3   08/03       AA      5
4   05/03       BB      2
5   06/03       BB      5
6   07/03       BB      8
7   08/03       BB      7
8   05/03       CC      3
9   06/03       CC      6
10  07/03       CC      9
11  08/03       CC      1
로그인 후 복사

위 내용은 변수와 날짜를 나타내는 값을 사용하여 넓은 Pandas DataFrame을 긴 형식으로 어떻게 변환합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿