Alat analisis data: Kuasai kemahiran mengubah suai nama lajur dalam Pandas
Pengenalan:
Semasa proses analisis data, kita sering menghadapi situasi di mana kita perlu mengubah suai nama lajur set data. Pandas ialah perpustakaan pemprosesan data yang biasa digunakan dalam Python, menyediakan fungsi yang fleksibel dan berkuasa untuk memproses dan menganalisis data. Hari ini, kami akan menumpukan pada teknik mengubah suai nama lajur dalam Panda dan menunjukkannya dengan contoh kod khusus.
1. Lihat nama lajur sedia ada
Pertama, kita perlu memahami nama lajur set data semasa. Dalam Pandas, gunakan df.columns
untuk melihat nama lajur DataFrame. Sebagai contoh, kami mempunyai bingkai data berikut df: df.columns
可以查看数据框(DataFrame)的列名。例如,我们有如下数据框df:
import pandas as pd
data = {'A': [1, 2, 3],
'B': [4, 5, 6],
'C': [7, 8, 9]}
df = pd.DataFrame(data)
Salin selepas log masuk
我们可以使用df.columns
print(df.columns)
Salin selepas log masuk
Salin selepas log masuk
Salin selepas log masuk
Salin selepas log masuk
Kita boleh menggunakan
df.columns
untuk melihat nama lajur df:
Index(['A', 'B', 'C'], dtype='object')
Salin selepas log masuk
Hasil larian adalah seperti berikut:
df.columns = ['New_A', 'B', 'C']
Salin selepas log masuk
2. Ubah suai nama lajur
Ubah suai nama lajur secara terus
Dalam Panda, kita boleh mengubah suai nama lajur secara langsung dengan memberikan nilai. Sebagai contoh, kami ingin mengubah suai nama lajur 'A' kepada 'New_A':
print(df.columns)
Salin selepas log masuk
Salin selepas log masuk
Salin selepas log masuk
Salin selepas log masuk
Selepas berjalan, semak nama lajur df sekali lagi:
Index(['New_A', 'B', 'C'], dtype='object')
Salin selepas log masuk
Hasil larian adalah seperti berikut:
df = df.rename(columns={'B': 'New_B'})
Salin selepas log masuk
Dengan cara ini, kami boleh mengubah suai semua yang diperlukan Nama lajur semuanya diubah suai sekaligus.
Gunakan fungsi rename() untuk mengubah suai nama lajur
Selain memberikan nilai terus untuk mengubah suai nama lajur, Pandas juga menyediakan fungsi rename() untuk mengubah suai nama lajur. Kaedah ini lebih fleksibel dan kami boleh mengubah suai beberapa nama lajur secara selektif. Sebagai contoh, jika kita menukar nama lajur 'B' kepada 'New_B', kita boleh menggunakan kod berikut:
print(df.columns)
Salin selepas log masuk
Salin selepas log masuk
Salin selepas log masuk
Salin selepas log masuk
Selepas dijalankan, semak nama lajur df sekali lagi:
Index(['New_A', 'New_B', 'C'], dtype='object')
Salin selepas log masuk
Hasil larian adalah seperti berikut:
df.columns = df.columns.map(lambda x: 'New_' + x)
Salin selepas log masuk
Dengan cara ini, kami hanya Nama lajur yang ditentukan diubah suai tanpa menjejaskan penamaan nama lajur lain.
Gunakan fungsi map() untuk mengubah suai sebahagian daripada nama lajur
Kadangkala, kita mungkin perlu mengubah suai sebahagian nama lajur, seperti menambah awalan di hadapan nama lajur. Gunakan fungsi map() untuk beroperasi pada nama lajur separa. Sebagai contoh, jika kita menambah awalan 'New_' di hadapan nama lajur, kita boleh menggunakan kod berikut:
print(df.columns)
Salin selepas log masuk
Salin selepas log masuk
Salin selepas log masuk
Salin selepas log masuk
Selepas berjalan, semak nama lajur df sekali lagi:
Index(['New_New_A', 'New_New_B', 'New_C'], dtype='object')
Salin selepas log masuk
Hasil larian adalah seperti berikut:
rrreee
Dengan cara ini, kita boleh membandingkan lajur Buat pengubahsuaian separa yang fleksibel kepada nama.
3. Senario aplikasi
Menguasai kemahiran mengubah suai nama lajur dalam Panda adalah sangat penting untuk tugasan analisis data. Berikut ialah contoh beberapa senario aplikasi:
- Pembersihan data: Semasa proses pembersihan data, selalunya perlu untuk menyeragamkan nama lajur dan mengubah suai nama lajur bukan standard kepada standard penamaan bersatu.
- Penggabungan data: Apabila menggunakan fungsi merge() atau join() untuk menggabungkan data, selalunya perlu mengubah suai nama lajur yang digabungkan untuk membezakan lajur daripada sumber data yang berbeza.
- Eksport data: Apabila mengeksport data ke fail Excel atau CSV, kami boleh mengubah suai nama lajur untuk menjadikannya lebih deskriptif dan meningkatkan kebolehbacaan fail.
Ringkasan:
Melalui pengenalan artikel ini, kami telah mempelajari tentang teknik mengubah suai nama lajur dalam Panda dan menunjukkannya dengan contoh kod khusus. Menguasai kemahiran ini boleh membantu kami mengubah suai nama lajur dengan lebih fleksibel semasa proses analisis data dan meningkatkan kecekapan pemprosesan dan analisis data. Pada masa yang sama, penamaan lajur yang munasabah juga membantu meningkatkan kebolehbacaan dan kebolehfahaman data, dan sangat membantu untuk tafsiran dan paparan visual hasil analisis data. Saya harap artikel ini akan membantu kerja analisis data anda, terima kasih kerana membaca! 🎜
Atas ialah kandungan terperinci Kuasai helah mengubah suai nama lajur dalam Pandas: alat penting untuk analisis data. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!