Erstellen einer neuen Spalte aus der Ausgabe von Pandas Groupby().sum()
Bei der Arbeit mit Daten in Python ist dies oft notwendig um Berechnungen durchzuführen und neue Spalten in einem DataFrame basierend auf vorhandenen Werten zu erstellen. In diesem Beispiel möchten wir eine neue Spalte (Data4) erstellen, die die Summe von Data3 für jedes Datum enthält.
Verwenden von .transform()
Um dies zu erreichen Dazu können wir die .transform()-Methode für die gruppierte Data3-Spalte verwenden. .transform() wendet eine Funktion auf jede Gruppe an und gibt eine Serie zurück, deren Index am ursprünglichen DataFrame ausgerichtet ist. Dadurch können wir die berechneten Werte als neue Spalte hinzufügen.
df['Data4'] = df['Data3'].groupby(df['Date']).transform('sum')
Im bereitgestellten Beispiel-DataFrame:
import pandas as pd df = pd.DataFrame({ 'Date': ['2015-05-08', '2015-05-07', '2015-05-06', '2015-05-05', '2015-05-08', '2015-05-07', '2015-05-06', '2015-05-05'], 'Sym': ['aapl', 'aapl', 'aapl', 'aapl', 'aaww', 'aaww', 'aaww', 'aaww'], 'Data2': [11, 8, 10, 15, 110, 60, 100, 40], 'Data3': [5, 8, 6, 1, 50, 100, 60, 120] })
Mit .transform() berechnen wir die Summe von Data3 für jedes Datum und weisen Sie es der neuen Spalte Data4 zu:
df['Data4'] = df['Data3'].groupby(df['Date']).transform('sum')
Der resultierende DataFrame enthält die gewünschten Data4 Spalte:
Date Sym Data2 Data3 Data4 0 2015-05-08 aapl 11 5 55 1 2015-05-07 aapl 8 8 108 2 2015-05-06 aapl 10 6 66 3 2015-05-05 aapl 15 1 121 4 2015-05-08 aaww 110 50 55 5 2015-05-07 aaww 60 100 108 6 2015-05-06 aaww 100 60 66 7 2015-05-05 aaww 40 120 121
Das obige ist der detaillierte Inhalt vonWie erstelle ich eine neue Spalte in Pandas DataFrame mit Groupby().sum() und .transform()?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!