Rumah > pembangunan bahagian belakang > Tutorial Python > Bagaimana untuk Mengelakkan Nilai NaN Apabila Menambah Jumlah Berkumpulan sebagai Lajur Baharu dalam Panda?

Bagaimana untuk Mengelakkan Nilai NaN Apabila Menambah Jumlah Berkumpulan sebagai Lajur Baharu dalam Panda?

Barbara Streisand
Lepaskan: 2024-12-22 19:59:17
asal
698 orang telah melayarinya

How to Avoid NaN Values When Adding Grouped Sums as a New Column in Pandas?

Mencipta Lajur Baharu daripada Penjumlahan Berkumpulan

Masalah

Apabila cuba mencipta lajur baharu dalam DataFrame daripada hasil operasi jumlah kumpulan menggunakan panda, sesetengah pengguna menemui nilai NaN dalam lajur baharu. Isu utama timbul apabila cuba menetapkan jumlah khusus kumpulan kepada baris individu.

Penyelesaian

Kunci untuk menyelesaikan isu ini ialah menggunakan fungsi transformasi, yang mengembalikan Siri dengan indeksnya sejajar kepada DataFrame. Dengan menggunakan transformasi, anda boleh menambah hasil sebagai lajur baharu pada DataFrame anda.

Pertimbangkan coretan kod berikut:

import pandas as pd

df = pd.DataFrame({
    'Date': ['2015-05-08', '2015-05-07', '2015-05-06', '2015-05-05',
             '2015-05-08', '2015-05-07', '2015-05-06', '2015-05-05'],
    'Sym': ['aapl', 'aapl', 'aapl', 'aapl', 'aaww', 'aaww', 'aaww', 'aaww'],
    'Data2': [11, 8, 10, 15, 110, 60, 100, 40],
    'Data3': [5, 8, 6, 1, 50, 100, 60, 120]
})

df['Data4'] = df['Data3'].groupby(df['Date']).transform('sum')

print(df)
Salin selepas log masuk

Output:

         Date   Sym  Data2  Data3  Data4
0  2015-05-08  aapl     11      5     55
1  2015-05-07  aapl      8      8    108
2  2015-05-06  aapl     10      6     66
3  2015-05-05  aapl     15      1    121
4  2015-05-08  aaww    110     50     55
5  2015-05-07  aaww     60    100    108
6  2015-05-06  aaww    100     60     66
7  2015-05-05  aaww     40    120    121
Salin selepas log masuk

Sebagai digambarkan, setiap baris dalam lajur baharu, Data4, kini mencerminkan jumlah nilai Data3 untuk kumpulan tarikh yang sepadan, dengan berkesan menangani masalah awal nilai NaN.

Atas ialah kandungan terperinci Bagaimana untuk Mengelakkan Nilai NaN Apabila Menambah Jumlah Berkumpulan sebagai Lajur Baharu dalam Panda?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:php.cn
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Artikel terbaru oleh pengarang
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan