Bagaimana untuk Mengira Perbezaan dalam Skor untuk Pelbagai Medan dalam Bingkai Data Pandas?

Linda Hamilton
Lepaskan: 2024-10-31 01:16:03
asal
582 orang telah melayarinya

How to Calculate the Difference in Scores for Multiple Fields in a Pandas DataFrame?

Pandas groupby on Multiple Fields with Difference Calculation

Dalam pengaturcaraan, memanipulasi data adalah penting dan Pandas ialah perpustakaan yang berkuasa untuk melaksanakan tugasan ini dengan cekap. Satu soalan biasa ialah cara mengumpulkan data mengikut berbilang medan dan mengira perbezaan. Mari kita terokai cara untuk mencapainya.

Masalah:

Pertimbangkan DataFrame dengan struktur berikut:

         date    site country  score
0  2018-01-01  google      us    100
1  2018-01-01  google      ch     50
2  2018-01-02  google      us     70
3  2018-01-03  google      us     60
... 
Salin selepas log masuk

Matlamatnya adalah untuk mencari Perbezaan markah 1/3/5 hari untuk setiap gabungan 'tapak/negara'.

Penyelesaian:

Untuk menyelesaikan masalah ini, kami boleh menggunakan kumpulan Pandas dan fungsi diff:

  1. Isih DataFrame:
df = df.sort_values(by=['site', 'country', 'date'])
Salin selepas log masuk

Isih memastikan data kami disusun untuk pengiraan pengumpulan dan perbezaan yang betul.

  1. Kumpulkan dan Kira Perbezaan:
df['diff'] = df.groupby(['site', 'country'])['score'].diff().fillna(0)
Salin selepas log masuk

Baris ini mengumpulkan DataFrame mengikut lajur 'tapak' dan 'negara' menggunakan kumpulan mengikut. Kemudian, ia mengira perbezaan antara setiap skor berturut-turut dalam setiap kumpulan menggunakan perbezaan. Hasilnya disimpan dalam lajur baharu yang dipanggil 'diff.' Sebarang nilai yang hilang digantikan dengan 0 menggunakan fillna(0).

Output:

DataFrame yang terhasil akan mengandungi lajur asal bersama lajur 'diff':

         date    site country  score  diff
0  2018-01-01      fb      es    100   0.0
1  2018-01-02      fb      gb    100   0.0
...
Salin selepas log masuk
Fungsi fillna(0) menggantikan nilai yang hilang dengan 0, tetapi anda boleh menukar ini kepada mana-mana nilai yang dikehendaki.

Kaedah ini boleh digunakan untuk mengira perbezaan pada sebarang selang masa (cth., 1 hari, 3 bulan, dsb.).

Atas ialah kandungan terperinci Bagaimana untuk Mengira Perbezaan dalam Skor untuk Pelbagai Medan dalam Bingkai Data Pandas?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:php.cn
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Artikel terbaru oleh pengarang
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan