Ermitteln des Maximums mehrerer Spalten in Pandas DataFrames
Bei der Datenanalyse ist das Ermitteln des Maximalwerts über mehrere Spalten hinweg eine häufige Aufgabe. In Python bietet die Pandas-Bibliothek effiziente Methoden zum Ausführen solcher Operationen.
Problemstellung:
Angenommen, Sie haben einen DataFrame mit den Spalten A und B und müssen dies tun Erstellen Sie eine neue Spalte C, in der jeder Wert das Maximum der entsprechenden Werte in den Spalten A und B ist.
Lösung:
Mit Pandas können Sie das Maximum einfach berechnen von mehreren Spalten mit der Max-Funktion. Die folgenden Schritte beschreiben, wie Spalte C erstellt wird:
import pandas as pd
Erstellen Sie einen DataFrame mit den Spalten A und B. Beispiel:
df = pd.DataFrame({"A": [1, 2, 3], "B": [-2, 8, 1]})
Verwenden Sie die Max-Funktion für die Spalten, die Sie vergleichen möchten, und geben Sie axis=1 an, um das Maximum für jede Zeile zu berechnen:
max_values = df[["A", "B"]].max(axis=1)
Fügen Sie die berechneten Maximalwerte als neue Spalte C zum DataFrame hinzu:
df["C"] = max_values
Der resultierende DataFrame df hat nun drei Spalten: A, B , und C, wobei Spalte C das Maximum der entsprechenden A- und B-Werte enthält.
Vereinfachte Lösung (für nur zwei Spalten):
Wenn Sie nur zwei haben Um die zu vergleichenden Spalten zu vergleichen, können Sie eine vereinfachte Version der obigen Lösung verwenden:
df["C"] = df.max(axis=1)
Dabei wird davon ausgegangen, dass die Spalten A und B die einzigen Spalten im DataFrame sind.
Zusätzliche Hinweise :
Das obige ist der detaillierte Inhalt vonWie finde ich den Maximalwert über mehrere Spalten in einem Pandas-DataFrame?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!