Beibehalten von Spalten während Groupby mit Auswahl des Mindestwerts
Problem:
Beim Durchführen eines Groupby Bei einer Operation auf einem Pandas-Datenrahmen zur Auswahl von Zeilen mit dem Mindestwert für eine bestimmte Spalte werden andere Spalten häufig versehentlich gelöscht. Dies kann problematisch sein, wenn zusätzliche Informationen aus diesen Spalten gewünscht werden.
Lösung 1: Verwendung von idxmin() für die Indexauswahl
Ein Ansatz besteht darin, die anderen Spalten beizubehalten um idxmin() zu verwenden, um die Indizes der Elemente mit dem Mindestwert für die angegebene Spalte zu erhalten. Diese Indizes können dann verwendet werden, um die entsprechenden Zeilen aus dem ursprünglichen Datenrahmen auszuwählen:
<code class="python">df_min = df.loc[df.groupby("item")["diff"].idxmin()]</code>
Lösung 2: Sortieren und Auswählen des ersten Elements
Eine alternative Methode ist um den Datenrahmen nach der Spalte mit dem Mindestwert zu sortieren und dann das erste Element aus jeder Gruppe auszuwählen:
<code class="python">df_min = df.sort_values("diff").groupby("item", as_index=False).first()</code>
Beispiel:
Beide Lösungen erzielen das gewünschte Ergebnis die anderen Spalten beizubehalten und gleichzeitig Zeilen mit dem Mindestwert für die angegebene Spalte auszuwählen:
<code class="python">df = pd.DataFrame({ "item": [1, 1, 1, 2, 2, 2, 2, 3, 3], "diff": [2, 1, 3, -1, 1, 4, -6, 0, 2], "otherstuff": [1, 2, 7, 0, 3, 9, 2, 0, 9] }) df_min_idx = df.loc[df.groupby("item")["diff"].idxmin()] df_min_sort = df.sort_values("diff").groupby("item", as_index=False).first() print(df_min_idx) print(df_min_sort)</code>
Ausgabe:
item diff otherstuff 1 1 1 2 6 2 -6 2 7 3 0 0 item diff otherstuff 0 1 1 2 1 2 -6 2 2 3 0 0
Das obige ist der detaillierte Inhalt vonWie behalte ich Spalten während der Gruppierung mit Auswahl des Mindestwerts in Pandas bei?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!