Heim > Backend-Entwicklung > Python-Tutorial > Wie füge ich nach einer groupby().sum()-Operation korrekt eine neue Spalte zu einem Pandas-DataFrame hinzu?

Wie füge ich nach einer groupby().sum()-Operation korrekt eine neue Spalte zu einem Pandas-DataFrame hinzu?

Patricia Arquette
Freigeben: 2024-12-16 20:31:10
Original
813 Leute haben es durchsucht

How to Correctly Add a New Column to a Pandas DataFrame After a groupby().sum() Operation?

Erstellen einer neuen Spalte aus der Ausgabe von pandas groupby().sum()

Beim Durchführen einer Berechnung für eine Spalte in einem Pandas DataFrame mithilfe von groupby() Funktion ist es oft notwendig, die Ergebnisse wieder in den DataFrame zu integrieren. Eine Möglichkeit, dies zu erreichen, besteht darin, eine neue Spalte basierend auf den gruppierten Berechnungen zu erstellen.

Im bereitgestellten Beispiel besteht das Ziel darin, eine neue Spalte, Data4, zu erstellen, die die Summe der Data3-Spalte für jedes Datum enthält .

Der vorgestellte Code versucht, die gruppierten Ergebnisse direkt der neuen Spalte zuzuordnen, liefert jedoch NaN-Werte. Um dieses Problem zu beheben, sollte stattdessen die Methode transform() verwendet werden:

df['Data4'] = df['Data3'].groupby(df['Date']).transform('sum')
Nach dem Login kopieren

Die Methode transform() gibt eine Reihe zurück, die am Index des DataFrame ausgerichtet ist, sodass diese direkt als neue Spalte hinzugefügt werden kann . Der Parameter „sum“ gibt die Berechnung an, die wir durchführen möchten.

Der aktualisierte Code unten zeigt die korrekte Anwendung von transform():

import pandas as pd

df = pd.DataFrame({
    'Date': ['2015-05-08', '2015-05-07', '2015-05-06', '2015-05-05',
             '2015-05-08', '2015-05-07', '2015-05-06', '2015-05-05'],
    'Sym': ['aapl', 'aapl', 'aapl', 'aapl', 'aaww', 'aaww', 'aaww', 'aaww'],
    'Data2': [11, 8, 10, 15, 110, 60, 100, 40],
    'Data3': [5, 8, 6, 1, 50, 100, 60, 120]
})

df['Data4'] = df['Data3'].groupby(df['Date']).transform('sum')

print(df)
Nach dem Login kopieren

Die Ausgabe des geänderten Codes berechnet korrekt Summe von Data3 für jedes Datum und fügt die Ergebnisse dem DataFrame als neue Spalte Data4:

         Date   Sym  Data2  Data3  Data4
0  2015-05-08  aapl     11      5     55
1  2015-05-07  aapl      8      8    108
2  2015-05-06  aapl     10      6     66
3  2015-05-05  aapl     15      1    121
4  2015-05-08  aaww    110     50     55
5  2015-05-07  aaww     60    100    108
6  2015-05-06  aaww    100     60     66
7  2015-05-05  aaww     40    120    121
Nach dem Login kopieren
hinzu

Das obige ist der detaillierte Inhalt vonWie füge ich nach einer groupby().sum()-Operation korrekt eine neue Spalte zu einem Pandas-DataFrame hinzu?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Quelle:php.cn
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Neueste Artikel des Autors
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage