Viele Datensätze verfügen über Zeilen, die verschiedene Entitäten darstellen, wobei jede mehrere Spalten enthält, die Daten zu den Entitäten darstellen. Manchmal ist es notwendig, die spezifische Spalte zu identifizieren, die den Maximalwert für jede Zeile enthält. Diese Aufgabe kann mit der Funktion idxmax() gelöst werden.
Im gegebenen Beispiel haben wir einen DataFrame mit vier Spalten: „Kommunikation und Suche“, „Geschäft“, „Allgemein“ und „Lebensstil“. Wir möchten eine neue Spalte „Max“ erstellen, die den Spaltennamen enthält, der dem Maximalwert jeder Zeile entspricht.
Dazu können wir idxmax(axis=1) verwenden, um den Spaltenindex zu finden mit dem Maximalwert:
df.idxmax(axis=1) # Output: 0 Communications 1 Business 2 Communications 3 Communications 4 Business dtype: object
Dies gibt uns die Spaltenbezeichnungen, aber wir können sie in die entsprechenden Spaltennamen umwandeln:
df['Max'] = df.idxmax(axis=1)
Der resultierende DataFrame wird so aussehen:
communications and search | business | general | lifestyle | max |
---|---|---|---|---|
0.745763 | 0.050847 | 0.118644 | 0.084746 | Communications |
0.333333 | 0.000000 | 0.583333 | 0.083333 | Business |
0.617021 | 0.042553 | 0.297872 | 0.042553 | Communications |
0.435897 | 0.000000 | 0.410256 | 0.153846 | Communications |
0.358974 | 0.076923 | 0.410256 | 0.153846 | Business |
Beachten Sie, dass idxmax() auch verwendet werden kann, um den Zeilenindex zu finden, bei dem der Maximalwert in jeder Spalte auftritt, indem Sie df.idxmax() verwenden. (oder df.idxmax(axis=0)).
Das obige ist der detaillierte Inhalt vonWie finde ich den Spaltennamen mit dem Maximalwert für jede Zeile in einem DataFrame?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!