Pemprosesan data yang cekap: Menggunakan Panda untuk mengubah suai nama lajur memerlukan contoh kod khusus
Pemprosesan data ialah pautan yang sangat penting dalam analisis data, dan semasa proses pemprosesan data, selalunya perlu mengubah suai nama lajur data . Pandas ialah perpustakaan pemprosesan data yang berkuasa yang menyediakan pelbagai kaedah dan fungsi untuk membantu kami memproses data dengan cepat dan cekap. Artikel ini akan memperkenalkan cara menggunakan Panda untuk mengubah suai nama lajur dan memberikan contoh kod khusus.
Dalam analisis data sebenar, nama lajur data asal mungkin mempunyai masalah seperti piawaian penamaan yang tidak konsisten dan kesukaran memahami, yang memerlukan kami mengubah suai nama lajur mengikut keperluan sebenar. Di bawah ialah contoh set data dengan tiga lajur data: nama, umur dan jantina.
import pandas as pd data = {'姓名': ['张三', '李四', '王五'], '年龄': [20, 25, 30], '性别': ['男', '女', '男']} df = pd.DataFrame(data) print(df)
Hasil keluaran adalah seperti berikut:
姓名 年龄 性别 0 张三 20 男 1 李四 25 女 2 王五 30 男
Seterusnya, kita perlu menukar bahasa Cina dalam nama lajur kepada bahasa Inggeris, menukar nama kepada nama, umur kepada umur, dan jantina kepada jantina. Berikut ialah contoh kod cara menggunakan Panda untuk mengubah suai nama lajur:
df.rename(columns={'姓名': 'name', '年龄': 'age', '性别': 'gender'}, inplace=True) print(df)
Hasil keluaran selepas mengubah suai nama lajur adalah seperti berikut:
name age gender 0 张三 20 男 1 李四 25 女 2 王五 30 男
Dalam kod di atas, kami menggunakan columns
menentukan nama lajur yang perlu diubah suai dan hubungan yang sepadan sebelum dan selepas pengubahsuaian dinyatakan dalam bentuk kamus. Parameter inplace
digunakan untuk menentukan sama ada untuk mengubah suai data asal Lalai ialah False
, yang bermaksud mengembalikan salinan data baharu yang diubah suai data asal, tetapkan ia adalah Benar
. rename
函数来修改列名。其中,columns
参数指定了需要修改的列名,并通过一个字典的形式指定了修改前后的对应关系。inplace
参数用于指定是否在原数据上进行修改,默认为False
,即返回修改后的新数据副本,若要在原数据上进行修改则将其设置为True
。
除了使用rename
函数之外,还可以直接通过给columns
属性赋值的方式来修改列名。下面是具体代码示例:
df.columns = ['name', 'age', 'gender'] print(df)
修改列名后的输出结果与上述代码相同。
除了以上的基本操作之外,Pandas还提供了一些更高级的方法来修改列名,如使用正则表达式进行批量修改,使用str
方法进行字符串替换等。在实际的数据处理过程中,根据不同的需求可以选择合适的方法来修改列名。
总结起来,使用Pandas修改列名非常简便,通过使用rename
函数或直接给columns
rename
, anda juga boleh mengubah suai nama lajur secara langsung dengan memberikan nilai kepada atribut lajur
. Berikut ialah contoh kod khusus: rrreee
Hasil keluaran selepas mengubah suai nama lajur adalah sama seperti kod di atas. 🎜🎜Selain daripada operasi asas di atas, Pandas juga menyediakan beberapa kaedah yang lebih maju untuk mengubah suai nama lajur, seperti menggunakan ungkapan biasa untuk pengubahsuaian kelompok, menggunakan kaedahstr
untuk penggantian rentetan, dsb. Dalam proses pemprosesan data sebenar, kaedah yang sesuai boleh dipilih untuk mengubah suai nama lajur mengikut keperluan yang berbeza. 🎜🎜Untuk meringkaskan, sangat mudah untuk mengubah suai nama lajur menggunakan Pandas Kami boleh mengubah suai nama lajur set data dengan menggunakan fungsi rename
atau memberikan nilai terus kepada . atribut columns
. Bergantung kepada keperluan sebenar, kaedah yang berbeza boleh dipilih untuk mencapai hasil yang kita inginkan. Pada masa yang sama, membiasakan diri dengan dan menguasai kaedah pemprosesan data lain berkaitan Pandas boleh membolehkan kami mengendalikan data dengan lebih cekap dalam analisis data. 🎜🎜Contoh kod khusus untuk menggunakan Panda untuk mengubah suai nama lajur adalah seperti di atas, saya harap artikel ini dapat membantu anda memahami dan menggunakan Panda untuk pemprosesan data. 🎜Atas ialah kandungan terperinci Menggunakan Panda untuk menamakan semula nama lajur untuk pemprosesan data yang cekap. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!