Heim > Backend-Entwicklung > Python-Tutorial > Wie füge ich mit „transform()' eine neue Spalte mit gruppierter Summierung in Pandas hinzu?

Wie füge ich mit „transform()' eine neue Spalte mit gruppierter Summierung in Pandas hinzu?

Mary-Kate Olsen
Freigeben: 2024-12-24 10:46:14
Original
868 Leute haben es durchsucht

How to Add a New Column with Grouped Summation in Pandas Using `transform()`?

Erstellen einer neuen Spalte basierend auf der gruppierten Summierung in Pandas

Problemstellung

Beim Versuch, eine neue Spalte basierend auf der Summierung eines Werts zu erstellen Gruppiert nach Datum mit der Funktion „groupby()“ von Pandas, werden NaN-Ergebnisse gefunden. Das Ziel besteht darin, eine Spalte hinzuzufügen, die die Gesamtsumme eines bestimmten Werts für alle Daten anzeigt, unabhängig von der Anzahl der Zeilen, die diesem Datum zugeordnet sind.

Lösung

Um dies zu erreichen, muss die Transformation durchgeführt werden ()-Funktion wird verwendet. Im Gegensatz zur Funktion apply(), die Zeile für Zeile arbeitet, führt transform() Berechnungen für gruppierte Daten durch und gibt eine Reihe zurück, die am ursprünglichen Datenrahmen ausgerichtet ist.

df['Data4'] = df['Data3'].groupby(df['Date']).transform('sum')
Nach dem Login kopieren
Nach dem Login kopieren

Hier finden Sie eine schrittweise Aufschlüsselung :

  • df['Data3'].groupby(df['Date']): Diese Zeile gruppiert die Spalte 'Data3' nach 'Datum'.
  • transform('sum'): Die Funktion 'transform' wird auf das gruppierte Objekt angewendet und berechnet die Summe von 'Data3' für jede Datumsgruppe.
  • Das Ergebnis ist eine Reihe, die am ursprünglichen Datenrahmen ausgerichtet ist, sodass sie als neue Spalte mit dem Namen „Data4“ hinzugefügt werden kann.

Beispiel Verwendung

Betrachten Sie den folgenden Datenrahmen:

         Date   Sym  Data2  Data3
0  2015-05-08  aapl     11      5
1  2015-05-07  aapl      8      8
2  2015-05-06  aapl     10      6
3  2015-05-05  aapl     15      1
4  2015-05-08  aaww    110     50
5  2015-05-07  aaww     60    100
6  2015-05-06  aaww    100     60
7  2015-05-05  aaww     40    120
Nach dem Login kopieren

Anwenden der transform()-Funktion:

df['Data4'] = df['Data3'].groupby(df['Date']).transform('sum')
Nach dem Login kopieren
Nach dem Login kopieren

Ergebnisse in:

         Date   Sym  Data2  Data3  Data4
0  2015-05-08  aapl     11      5     55
1  2015-05-07  aapl      8      8    108
2  2015-05-06  aapl     10      6     66
3  2015-05-05  aapl     15      1    121
4  2015-05-08  aaww    110     50     55
5  2015-05-07  aaww     60    100    108
6  2015-05-06  aaww    100     60     66
7  2015-05-05  aaww     40    120    121
Nach dem Login kopieren

As Aus der Ausgabe geht hervor, dass die Spalte „Data4“ jetzt die Summe von „Data3“ für jedes eindeutige „Datum“ enthält. Wert.

Das obige ist der detaillierte Inhalt vonWie füge ich mit „transform()' eine neue Spalte mit gruppierter Summierung in Pandas hinzu?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Quelle:php.cn
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Neueste Artikel des Autors
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage