Kumpulkan mengikut berbilang medan dalam turutan, contoh kod khusus diperlukan
Dalam pemprosesan dan analisis data, selalunya perlu untuk mengumpulkan data dan melaksanakan operasi pengumpulan dalam susunan berbilang medan. Hari ini, kami akan memperkenalkan cara menggunakan perpustakaan panda dalam Python untuk melaksanakan operasi kumpulan mengikut pelbagai medan dan menyediakan contoh kod khusus.
Sebelum kita mula, kita perlu memasang dan mengimport perpustakaan panda, dan memuatkan data yang ingin kita proses. Katakan kita mempunyai set data pesanan jualan, yang mengandungi medan seperti nombor pesanan (id_pesanan), nama produk (nama_produk), nama pelanggan (nama_pelanggan) dan volum jualan (jualan).
Mula-mula, mari belajar tentang penggunaan asas groupby. Fungsi groupby boleh mengumpulkan data mengikut medan yang ditentukan dan mengembalikan objek GroupBy. Kami selanjutnya boleh melakukan satu siri operasi pada objek GroupBy, seperti pengiraan pengagregatan, penapisan data, dsb.
import pandas as pd # 加载数据 data = pd.read_csv('sales_order.csv') # 根据"order_id"字段进行分组 grouped = data.groupby('order_id') # 对每组数据进行求和操作 result = grouped.sum() print(result)
Dalam kod di atas, kami mula-mula menggunakan fungsi pd.read_csv
untuk memuatkan fail csv bernama "sales_order.csv", dan kemudian menggunakan fungsi groupby
berdasarkan Data kumpulan medan "order_id". Kemudian, gunakan fungsi sum
untuk melakukan operasi jumlah pada setiap set data untuk mendapatkan hasil akhir. pd.read_csv
函数加载了一个名为"sales_order.csv"的csv文件,然后使用groupby
函数根据"order_id"字段对数据进行分组。接着,利用sum
函数对每组数据进行求和操作,得到了最终的结果。
然而,有时我们需要根据多个字段进行分组操作,即按照先后顺序进行多级分组。对于这种情况,我们可以借助多次调用groupby
函数来完成。
以下是一个示例,我们将同时按照"order_id"和"product_name"字段进行分组操作:
# 根据"order_id"和"product_name"字段进行分组 grouped = data.groupby(['order_id', 'product_name']) # 对每组数据进行求和操作 result = grouped.sum() print(result)
通过将要分组的字段名作为一个列表传递给groupby
函数,我们就可以实现多字段的分组操作。上述代码中,我们根据"order_id"和"product_name"字段进行了分组,并对每组数据进行了求和操作。
此外,我们还可以根据不同的字段指定不同的分组方式。例如,在上述代码中,我们可以先按照"order_id"字段进行分组,再按照"product_name"字段进行分组,此时需要先后调用两次groupby
groupby
beberapa kali. Berikut ialah contoh di mana kami akan mengumpulkan mengikut kedua-dua medan "order_id" dan "product_name": # 根据"order_id"字段进行分组 grouped = data.groupby('order_id') # 根据"product_name字段进行分组 result = grouped.groupby('product_name').sum() print(result)
groupby
, kami boleh Melaksanakan operasi kumpulan pelbagai medan. Dalam kod di atas, kami mengumpulkan mengikut medan "id_pesanan" dan "nama_produk", dan melakukan operasi jumlah pada setiap kumpulan data. Selain itu, kami juga boleh menentukan kaedah pengelompokan yang berbeza berdasarkan bidang yang berbeza. Sebagai contoh, dalam kod di atas, kita boleh mengumpulkan mengikut medan "order_id" dahulu, dan kemudian mengumpulkan mengikut medan "product_name" Dalam kes ini, kita perlu memanggil fungsi groupby
dua kali. 🎜🎜Berikut ialah contoh Kami mula-mula mengumpulkan berdasarkan medan "id_pesanan", dan kemudian mengumpulkan berdasarkan medan "nama_produk": 🎜rrreee🎜Dengan cara ini, kami boleh melakukan operasi pengelompokan dalam susunan berbilang medan, dan kumpulan setiap Pengiraan agregat pada data kumpulan. Dalam kod di atas, kami mula-mula mengumpulkan berdasarkan medan "id_pesanan", kemudian mengumpulkan berdasarkan setiap kumpulan data berdasarkan medan "nama_produk", dan akhirnya melakukan operasi jumlah pada setiap kumpulan data. 🎜🎜Ringkasnya, kita boleh menggunakan fungsi groupby dalam perpustakaan panda untuk melaksanakan operasi kumpulan berbilang medan. Sama ada pengumpulan medan tunggal atau pengumpulan berurutan berbilang medan, kita boleh mencapainya melalui kod mudah. Ini akan memudahkan kerja kami dalam pemprosesan dan analisis data. 🎜Atas ialah kandungan terperinci Himpunkan mengikut berbilang medan mengikut tertib. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!