Heim > Backend-Entwicklung > Python-Tutorial > Wie kann ich die Top-Datensätze jeder Gruppe in einem Pandas-DataFrame effizient abrufen?

Wie kann ich die Top-Datensätze jeder Gruppe in einem Pandas-DataFrame effizient abrufen?

Barbara Streisand
Freigeben: 2024-11-25 18:03:10
Original
724 Leute haben es durchsucht

How Can I Efficiently Get the Top Records from Each Group in a Pandas DataFrame?

Pandas: Effizientes Abrufen der obersten Datensätze innerhalb von Gruppen

Bei der Arbeit mit Pandas DataFrames ist es häufig erforderlich, die führenden Datensätze aus jeder Gruppe zu extrahieren . Ein gängiger Ansatz besteht darin, die Funktionen „Gruppieren nach“ und „Anwenden“ zu verwenden, um Datensätze innerhalb jeder Gruppe aufzuzählen.

dfN = df.groupby('id').apply(lambda x:x['value'].reset_index()).reset_index()
Nach dem Login kopieren

Es gibt jedoch einen optimierteren Ansatz:

df.groupby('id').head(2)
Nach dem Login kopieren

Dieser Die Methode ruft die obersten Datensätze direkt ab, ohne dass Zwischenberechnungen erforderlich sind. Darüber hinaus behält der generierte DataFrame seinen ursprünglichen Index bei.

Um den resultierenden MultiIndex zu reduzieren, verwenden Sie:

df.groupby('id').head(2).reset_index(drop=True)
Nach dem Login kopieren

Dadurch wird der folgende DataFrame erzeugt:

id value
1 1
1 2
2 1
2 2
3 1
4 1

Alternativ können Sie die Fensterfunktion „row_number()“ von SQL verwenden, um Datensätze innerhalb von Gruppen effizient aufzuzählen. Diese Funktion ist derzeit jedoch in Pandas nicht verfügbar.

Das obige ist der detaillierte Inhalt vonWie kann ich die Top-Datensätze jeder Gruppe in einem Pandas-DataFrame effizient abrufen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Quelle:php.cn
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Neueste Artikel des Autors
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage