Rumah > pembangunan bahagian belakang > Tutorial Python > Bagaimana untuk Menggabungkan Bingkai Data Berbilang Panda Dengan Cekap Berdasarkan Lajur Biasa?

Bagaimana untuk Menggabungkan Bingkai Data Berbilang Panda Dengan Cekap Berdasarkan Lajur Biasa?

Barbara Streisand
Lepaskan: 2024-11-25 15:25:16
asal
838 orang telah melayarinya

How to Efficiently Merge Multiple Pandas DataFrames Based on a Common Column?

Menggabungkan Berbilang Bingkai Data pada Lajur dalam Panda dengan Gabungan Tiga Hala

Penggabungan data, tugas asas dalam analisis data, membolehkan anda menggabungkan data daripada pelbagai sumber. Dalam Pandas, fungsi join() ialah alat yang berkuasa untuk menggabungkan bingkai data. Walau bagaimanapun, apabila menyertai berbilang bingkai data, anda mungkin menghadapi cabaran yang berkaitan dengan skim pengindeksan hierarki.

Gabungan Tiga Hala Menggunakan Lajur Biasa

Pertimbangkan senario di mana anda mempunyai tiga Fail CSV, setiap satu mengandungi maklumat tentang kumpulan orang yang sama. Lajur pertama dalam setiap fail ialah nama orang itu, manakala lajur seterusnya mewakili atribut mereka. Matlamat anda adalah untuk menggabungkan fail ini menjadi satu CSV, dengan setiap baris mengandungi semua atribut untuk setiap orang yang unik.

Pengindeksan Hierarki dan Berbilang Indeks

Dalam Panda, multi-indeks merujuk kepada skema pengindeksan di mana setiap tahap indeks mewakili lajur yang berbeza. Apabila menyertai bingkai data, indeks berbilang digunakan untuk menjajarkan data berdasarkan nilai yang dikongsi. Dalam kes anda, fungsi "sertai" mungkin menyatakan bahawa anda memerlukan berbilang indeks kerana anda bergabung pada satu lajur (nama), yang merupakan indeks dalam setiap bingkai data.

Menggabungkan Bingkai Data tanpa Pengindeksan Hierarki

Walau bagaimanapun, sesetengah senario mungkin tidak memerlukan pengindeksan hierarki. Jika bingkai data mempunyai lajur biasa, anda boleh menggunakan fungsi lambda dan pakej functools untuk memudahkan proses penggabungan. Berikut ialah contoh:

import pandas as pd
import functools as ft

dfs = [df1, df2, df3, ..., dfN]

df_final = ft.reduce(lambda left, right: pd.merge(left, right, on='name'), dfs)
Salin selepas log masuk

Dalam kod ini:

  • dfs ialah senarai yang mengandungi bingkai data yang akan digabungkan.
  • ft.reduce menggunakan fungsi lambda pada setiap pasangan bingkai data, menggabungkannya berdasarkan lajur "nama".
  • df_final ialah bingkai data yang terhasil, mengandungi semua atribut untuk setiap orang yang unik.

Pendekatan ini mudah untuk menggabungkan berbilang bingkai data tanpa perlu menentukan skim pengindeksan hierarki yang kompleks.

Atas ialah kandungan terperinci Bagaimana untuk Menggabungkan Bingkai Data Berbilang Panda Dengan Cekap Berdasarkan Lajur Biasa?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:php.cn
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Artikel terbaru oleh pengarang
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan