Rumah > pembangunan bahagian belakang > Tutorial Python > Bagaimanakah Panda Dapat Memudahkan Penggabungan Berbilang DataFrames?

Bagaimanakah Panda Dapat Memudahkan Penggabungan Berbilang DataFrames?

Barbara Streisand
Lepaskan: 2024-11-12 09:56:02
asal
423 orang telah melayarinya

How Can Pandas Simplify Merging Multiple DataFrames?

Menggabungkan Berbilang Bingkai Data dengan Berkesan Menggunakan Panda

Apabila bekerja dengan projek sains data, selalunya perlu menggabungkan berbilang bingkai data untuk menggabungkan maklumat mereka. Ini boleh menjadi tugas yang rumit, terutamanya apabila berurusan dengan berbilang bingkai data yang mungkin mempunyai struktur dan kiraan baris yang berbeza.

Mengapa Tidak Rekursi?

Rekursi, seperti yang dilaksanakan dalam kod yang disediakan, mungkin bukan pendekatan terbaik untuk menggabungkan berbilang bingkai data dengan cekap. Walaupun rekursi boleh menyelesaikan beberapa jenis masalah dengan berkesan, ia tidak sesuai untuk tugasan khusus ini. Ia boleh membawa kepada pengiraan yang tidak perlu dan boleh menjadi rumit untuk dikendalikan.

Panda: Penyelesaian Komprehensif

Panda, perpustakaan manipulasi data Python yang berkuasa, menyediakan pustaka manipulasi data yang mudah dan cekap cara untuk menggabungkan berbilang bingkai data. Ia membolehkan kedua-dua cantuman dalaman dan luaran, serta keupayaan untuk menentukan kunci yang perlu dilakukan cantuman.

Gabung Menggunakan Pandas.merge

Untuk menggabungkan dua bingkai data df1 dan df2 menggunakan Panda, anda boleh menggunakan kaedah .merge(), seperti jadi:

merged_df = df1.merge(df2, on='date')
Salin selepas log masuk

Di sini, 'tarikh' mewakili lajur yang penggabungan dilakukan.

Penyelesaian yang Lebih Elegan: reduce() dan Fungsi Lambda

Untuk menggabungkan berbilang bingkai data, salah satu pendekatan yang paling mudah ialah menggunakan fungsi reduce() bersama-sama dengan lambda fungsi, seperti yang ditunjukkan di bawah:

dfs = [df1, df2, df3]

df_merged = reduce(lambda left, right: pd.merge(left, right, on='date', how='outer'), dfs)
Salin selepas log masuk

Dalam contoh ini:

  • dfs ialah senarai yang mengandungi bingkai data yang akan digabungkan.
  • Fungsi lambda melaksanakan operasi cantum pada setiap pasangan bingkai data.
  • Lajur 'tarikh' digunakan sebagai cantuman kunci.
  • Parameter how='outer' memastikan semua baris daripada kedua-dua bingkai data disertakan dalam hasil gabungan, walaupun ia tidak sepadan pada kunci cantum.

Pendekatan ini menyediakan cara ringkas dan cekap untuk menggabungkan berbilang bingkai data, tanpa mengira bilangan atau struktur.

Kesimpulan

Menggabungkan berbilang bingkai data boleh dipermudahkan melalui penggunaan kaedah .merge() Pandas dan fungsi reduce() dengan ungkapan lambda. Teknik ini menghapuskan kerumitan rekursi dan memastikan proses penggabungan yang bersih dan cekap.

Atas ialah kandungan terperinci Bagaimanakah Panda Dapat Memudahkan Penggabungan Berbilang DataFrames?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:php.cn
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Artikel terbaru oleh pengarang
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan