Python ialah bahasa pengaturcaraan peringkat tinggi dan serba boleh yang telah menjadi semakin popular sejak beberapa tahun kebelakangan ini, sebahagiannya kerana keupayaannya untuk mengendalikan sejumlah besar data dengan mudah. Pustaka panda ialah salah satu alat yang paling berkuasa untuk bekerja dengan data dalam ekosistem Python, menyediakan struktur data yang mudah digunakan seperti DataFrame dan Series.
Dalam tutorial ini, kami akan menumpukan pada tugas biasa dalam analisis data: menukar senarai ke dalam baris DataFrame dalam Python menggunakan panda. Ini adalah kemahiran penting untuk sesiapa sahaja yang bekerja dengan data dalam Python, kerana ia membolehkan anda menambah baris data baharu dengan cepat dan mudah pada DataFrame. Dalam baki artikel ini, kami akan membimbing anda melalui proses langkah demi langkah untuk menukar senarai ke dalam baris DataFrame.
Untuk menukar senarai ke dalam baris DataFrame, kami akan menggunakan perpustakaan Pandas. Mula-mula pastikan panda dipasang pada sistem kami.
Untuk memasang panda, anda boleh menggunakan pengurus pakej Python yang dipanggil pip, yang boleh diakses melalui command prompt atau terminal. Untuk melakukan ini, hanya masukkan arahan yang disediakan di bawah.
pip install pandas
Arahan di atas akan memuat turun dan memasang versi terkini Panda pada sistem anda. Setelah dipasang, kami boleh menggunakannya untuk menukar senarai ke dalam baris DataFrame.
Untuk menukar senarai ke dalam baris DataFrame, kami perlu membuat senarai yang mengandungi data yang ingin kami tambahkan dahulu. Senarai ini harus mengandungi bilangan elemen yang sama dengan bilangan lajur dalam DataFrame. Katakan kita mempunyai DataFrame dengan tiga lajur - "Nama", "Umur" dan "Bandar".
Pertimbangkan coretan kod berikut untuk membuat senarai data baris baharu:
new_row_data = ['Prince', 26, 'New Delhi]
Langkah penting seterusnya dalam proses kami ialah menjana objek DataFrame serba baharu yang menyalin nama lajur DataFrame sedia ada. Adalah penting untuk memastikan bahawa nama lajur sepadan untuk menambahkan baris baharu dengan cekap pada DataFrame menggunakan panda.
Untuk mencapai matlamat ini, kami boleh mencipta DataFrame kosong dengan nama lajur yang sama seperti DataFrame asal.
df = pd.DataFrame(columns=['Name', 'Age', 'City'])
Sekarang kami telah mencipta DataFrame kosong baharu dengan nama lajur yang sesuai, tiba masanya untuk menambah beberapa data padanya. Kami boleh melakukan ini dengan menggunakan kaedah "tambah" objek DataFrame, yang membolehkan kami menambah baris data baharu pada DataFrame sedia ada. Untuk melakukan ini, kita perlu menghantar objek Siri panda kepada kaedah "tambah" yang mewakili baris data baharu.
Untuk mengelak daripada menulis ganti mana-mana baris sedia ada dalam DataFrame, kita mesti lulus parameter "ignore_index=True" apabila menambahkan baris baharu. Ini memastikan bahawa baris baharu dilampirkan sebagai baris baharu sepenuhnya dengan nombor indeks yang unik.
Pertimbangkan kod di bawah, yang menambahkan baris baharu pada bingkai data kami menggunakan kaedah tambah.
import pandas as pd # create a list of data for the new row new_row_data = ['Prince', 26, 'New Delhi'] # create a new empty DataFrame with the correct column names df = pd.DataFrame(columns=['Name', 'Age', 'City']) # append the new row to the DataFrame df = df.append(pd.Series(new_row_data, index=df.columns), ignore_index=True) # print the updated DataFrame print(df)
Dalam kod di atas, kami mula-mula mengimport perpustakaan panda. Seterusnya, kami mencipta senarai yang dipanggil "new_row_data" yang mengandungi nilai yang ingin kami tambahkan sebagai baris baharu pada DataFrame. Kami kemudian mencipta objek DataFrame kosong baharu bernama "df" dengan nama lajur yang sama seperti DataFrame sedia ada.
Seterusnya, kami menambahkan baris baharu pada DataFrame menggunakan kaedah "tambah" objek DataFrame. Kami menghantar objek Siri panda kepada kaedah "tambah", yang mewakili baris data baharu kami. Kami menggunakan parameter "ignore_index=True" untuk memastikan bahawa baris baharu dilampirkan sebagai baris baharu dengan nombor indeks baharu dan bukannya menimpa baris sedia ada.
Akhir sekali, kami mencetak DataFrame yang dikemas kini untuk mengesahkan bahawa baris baharu kami berjaya ditambahkan.
Name Age City 0 Prince 26 New Delhi
Seperti yang anda lihat dalam output di atas, set data berstruktur dalam bentuk DataFrame terdiri daripada satu baris dan tiga lajur, setiap lajur mempunyai labelnya sendiri. Label lajur ialah Nama, Umur dan Bandar.
Dalam tutorial ini, kami belajar cara menukar senarai ke baris DataFrame dalam Python menggunakan perpustakaan Pandas. Mula-mula kami memastikan panda dipasang pada sistem kami dan kemudian membuat senarai yang mengandungi data yang kami mahu tambah sebagai baris baharu pada DataFrame. Kami kemudian mencipta objek DataFrame kosong baharu dengan nama lajur yang sama seperti DataFrame sedia ada dan menambah baris data baharu menggunakan kaedah "tambah". Kami menggunakan parameter "ignore_index=True" untuk memastikan bahawa baris baharu dilampirkan sebagai baris baharu dengan nombor indeks baharu dan bukannya menimpa baris sedia ada. Kami memberikan contoh untuk setiap kaedah yang digunakan dalam proses ini.
Atas ialah kandungan terperinci Bagaimana untuk menukar senarai ke baris DataFrame dalam Python?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!