Zeilen mit maximalem Wert in Gruppen mithilfe von Groupby abrufen
Identifizieren aller Zeilen innerhalb eines Pandas-DataFrames, die den maximalen Wert in einer bestimmten Spalte aufweisen innerhalb gruppierter Daten ist eine häufige Aufgabe. Dies kann mithilfe von Groupby-Operationen und einer Reihe von Transformationen effizient erreicht werden.
Um die Zeilen mit der maximalen Anzahl innerhalb jeder durch die Spalten Sp und Mt definierten Gruppe zu finden, führen wir die folgenden Schritte aus:
Beispiel 1:
Bedenken Sie Folgendes DataFrame:
Sp Mt Value count 0 MM1 S1 a 3 1 MM1 S1 n 2 2 MM1 S3 cb 5 3 MM2 S3 mk 8 4 MM2 S4 bg 10 5 MM2 S4 dgd 1 6 MM4 S2 rd 2 7 MM4 S2 cb 2 8 MM4 S2 uyi 7
Durch die Anwendung der obigen Schritte erhalten wir die gewünschte Ausgabe:
Sp Mt Value count 0 MM1 S1 a 3 2 MM1 S3 cb 5 3 MM2 S3 mk 8 4 MM2 S4 bg 10 8 MM4 S2 uyi 7
Beispiel 2:
Für einen anderen DataFrame :
Sp Mt Value count 4 MM2 S4 bg 10 5 MM2 S4 dgd 1 6 MM4 S2 rd 2 7 MM4 S2 cb 8 8 MM4 S2 uyi 8
Das Ergebnis wird sein:
Sp Mt Value count 4 MM2 S4 bg 10 7 MM4 S2 cb 8 8 MM4 S2 uyi 8
Hinweis: Wenn mehrere Zeilen innerhalb einer Gruppe die gleiche maximale Anzahl haben, werden alle diese Zeilen in die Ausgabe einbezogen. Wenn dies unerwünscht ist, kann eine weitere Filterung erforderlich sein.
Das obige ist der detaillierte Inhalt vonWie finde ich Zeilen mit Maximalwerten innerhalb von Gruppen in einem Pandas DataFrame?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!