Heim > Backend-Entwicklung > Python-Tutorial > Wie erstelle ich eine neue Spalte in Pandas DataFrame mit Groupby().sum() und .transform()?

Wie erstelle ich eine neue Spalte in Pandas DataFrame mit Groupby().sum() und .transform()?

Mary-Kate Olsen
Freigeben: 2024-12-24 04:43:13
Original
197 Leute haben es durchsucht

How to Create a New Column in Pandas DataFrame Using Groupby().sum() and .transform()?

Erstellen einer neuen Spalte aus der Ausgabe von Pandas Groupby().sum()

Bei der Arbeit mit Daten in Python ist dies oft notwendig um Berechnungen durchzuführen und neue Spalten in einem DataFrame basierend auf vorhandenen Werten zu erstellen. In diesem Beispiel möchten wir eine neue Spalte (Data4) erstellen, die die Summe von Data3 für jedes Datum enthält.

Verwenden von .transform()

Um dies zu erreichen Dazu können wir die .transform()-Methode für die gruppierte Data3-Spalte verwenden. .transform() wendet eine Funktion auf jede Gruppe an und gibt eine Serie zurück, deren Index am ursprünglichen DataFrame ausgerichtet ist. Dadurch können wir die berechneten Werte als neue Spalte hinzufügen.

df['Data4'] = df['Data3'].groupby(df['Date']).transform('sum')
Nach dem Login kopieren
Nach dem Login kopieren

Im bereitgestellten Beispiel-DataFrame:

import pandas as pd

df = pd.DataFrame({
    'Date': ['2015-05-08', '2015-05-07', '2015-05-06', '2015-05-05',
             '2015-05-08', '2015-05-07', '2015-05-06', '2015-05-05'],
    'Sym': ['aapl', 'aapl', 'aapl', 'aapl', 'aaww', 'aaww', 'aaww', 'aaww'],
    'Data2': [11, 8, 10, 15, 110, 60, 100, 40],
    'Data3': [5, 8, 6, 1, 50, 100, 60, 120]
})
Nach dem Login kopieren

Mit .transform() berechnen wir die Summe von Data3 für jedes Datum und weisen Sie es der neuen Spalte Data4 zu:

df['Data4'] = df['Data3'].groupby(df['Date']).transform('sum')
Nach dem Login kopieren
Nach dem Login kopieren

Der resultierende DataFrame enthält die gewünschten Data4 Spalte:

         Date   Sym  Data2  Data3  Data4
0  2015-05-08  aapl     11      5     55
1  2015-05-07  aapl      8      8    108
2  2015-05-06  aapl     10      6     66
3  2015-05-05  aapl     15      1    121
4  2015-05-08  aaww    110     50     55
5  2015-05-07  aaww     60    100    108
6  2015-05-06  aaww    100     60     66
7  2015-05-05  aaww     40    120    121
Nach dem Login kopieren

Das obige ist der detaillierte Inhalt vonWie erstelle ich eine neue Spalte in Pandas DataFrame mit Groupby().sum() und .transform()?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Quelle:php.cn
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Neueste Artikel des Autors
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage