Rumah > pembangunan bahagian belakang > Tutorial Python > Bagaimanakah saya boleh membentuk semula data yang panjang ke dalam format yang luas dengan berbilang pembolehubah menggunakan Panda?

Bagaimanakah saya boleh membentuk semula data yang panjang ke dalam format yang luas dengan berbilang pembolehubah menggunakan Panda?

Barbara Streisand
Lepaskan: 2024-10-30 07:38:27
asal
654 orang telah melayarinya

How can I reshape long data into a wide format with multiple variables using Pandas?

Bentuk Semula Data Panjang ke dalam Format Luas dengan Panda

Apabila bekerja dengan data dalam format panjang, anda mungkin perlu membentuk semula data itu menjadi format yang luas untuk analisis dan visualisasi yang lebih baik. Satu cabaran biasa ialah untuk membentuk semula data berdasarkan berbilang pembolehubah.

Pertimbangkan kerangka data berikut:

salesman  height  product  price
Knut      6        bat          5
Knut      6        ball         1
Knut      6        wand         3
Steve     5        pen          2
Salin selepas log masuk

Matlamatnya adalah untuk membentuk semula data ini ke dalam format yang luas:

salesman  height    product_1  price_1  product_2 price_2 product_3 price_3  
Knut      6        bat          5       ball      1        wand      3
Steve     5        pen          2        NA       NA        NA       NA
Salin selepas log masuk

Walaupun cair/tindan/nyahtindan biasanya digunakan untuk membentuk semula data, data tersebut mungkin tidak sesuai untuk senario khusus ini.

Penyelesaian kepada masalah ini boleh didapati menggunakan kod berikut:

<code class="python">import pandas as pd

# Create sample data
raw_data = {
    'salesman': ['Knut', 'Knut', 'Knut', 'Steve'],
    'height': [6, 6, 6, 5],
    'product': ['bat', 'ball', 'wand', 'pen'],
    'price': [5, 1, 3, 2]
}

df = pd.DataFrame(raw_data)

# Reshape data
df_wide = df.pivot_table(index=['salesman', 'height'], columns='product', values='price')

# Reset index to get it in the desired format
df_wide = df_wide.reset_index(level=[0, 1])

# Rename columns
new_columns = ['salesman', 'height'] + [f'product_{i}' for i in range(1, df_wide.shape[1] - 1)] + [f'price_{i}' for i in range(1, df_wide.shape[1] - 1)]
df_wide.columns = new_columns

# Handle missing values
df_wide.fillna("NA", inplace=True)</code>
Salin selepas log masuk

Bingkai data yang terhasil df_wide akan berada dalam format lebar yang diingini.

Atas ialah kandungan terperinci Bagaimanakah saya boleh membentuk semula data yang panjang ke dalam format yang luas dengan berbilang pembolehubah menggunakan Panda?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:php.cn
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Artikel terbaru oleh pengarang
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan