So summieren Sie DataFrame-Zeilen für bestimmte Spalten in Pandas
Für einen bestimmten DataFrame kann es erforderlich sein, die Summe der Werte übereinander zu berechnen bestimmte Zeilen. Beim Versuch, dies über df[['a', 'b', 'd']].map(sum) zu erreichen, können Probleme auftreten.
Der geeignete Vorgang für diese Aufgabe umfasst die Verwendung von sum() mit Achse=1. Diese Operation berechnet die Summe jeder Zeile und ignoriert nicht numerische Spalten. Um die Genauigkeit sicherzustellen, wird empfohlen, numeric_only=True anzugeben, insbesondere in Pandas-Versionen 2.0 und höher.
Betrachten Sie beispielsweise einen DataFrame mit den Spalten „a“, „b“, „c“ und „d“. , wobei „c“ eine nicht numerische Spalte ist:
df = pd.DataFrame({'a': [1, 2, 3], 'b': [2, 3, 4], 'c': ['dd', 'ee', 'ff'], 'd': [5, 9, 1]})
Um die Summe der Spalten „a“, „b“ und „d“ zu berechnen, können wir Verwenden Sie:
df['e'] = df.sum(axis=1, numeric_only=True)
Dadurch wird eine Spalte „e“ hinzugefügt, die die Summe der gewünschten Spalten enthält.
Wenn Sie bestimmte Spalten summieren und andere ausschließen möchten, können Sie eine Liste angeben Spalten und entfernen Sie alle unerwünschten mit col_list.remove(column_name).
col_list = list(df) col_list.remove('d') df['e'] = df[col_list].sum(axis=1)
Dadurch wird eine neue Spalte „e“ mit der Summe der angegebenen erstellt Spalten.
Das obige ist der detaillierte Inhalt vonWie summiere ich bestimmte DataFrame-Zeilen in Pandas?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!