Dalam analisis data, menukar bingkai data adalah penting untuk menyusun data ke dalam format yang lebih sesuai. Satu kes penggunaan biasa ialah memutarkan bingkai data berdasarkan nilai lajur tertentu.
Untuk jadual CSV yang mengandungi data seperti berikut:
Indicator Country Year Value 1 Angola 2005 6 2 Angola 2005 13 3 Angola 2005 10 4 Angola 2005 11 5 Angola 2005 5 1 Angola 2006 3 2 Angola 2006 2 3 Angola 2006 7 4 Angola 2006 3 5 Angola 2006 6
anda boleh memutar bingkai data untuk mendapatkan format ini:
Country Year 1 2 3 4 5 Angola 2005 6 13 10 11 5 Angola 2006 3 2 7 3 6
Untuk mencapai transformasi ini, anda boleh menggunakan kaedah .pivot sebagai berikut:
out = df.pivot(index=['Country', 'Year'], columns='Indicator', values='Value') print(out)
Untuk data dengan gabungan label pendua, anda boleh menggunakan kaedah .pivot_table, yang menggunakan pengiraan min secara lalai:
out = df.pivot_table( index=['Country', 'Year'], columns='Indicator', values='Value') print(out.rename_axis(columns=None).reset_index())
Dengan menggunakan .rename_axis dan . kaedah reset_index, anda boleh memulihkan kerangka data kepada format jadual rata.
Rujuk kepada Panduan pengguna Pandas untuk dokumentasi mendalam tentang pembentukan semula dan jadual pangsi.
Atas ialah kandungan terperinci Bagaimanakah Saya Boleh Memusing Bingkai Data Pandas untuk Membentuk Semula Data mengikut Lajur Tertentu?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!