Datenrahmenzeilen mit Operatorverkettung filtern
Während Pandas umfassende Unterstützung für die Operatorverkettung in verschiedenen Vorgängen bietet (gruppieren, aggregieren, anwenden), Die Möglichkeit, Zeilen mit dieser Methode zu filtern, scheint begrenzt zu sein. Stattdessen verwenden Benutzer traditionell die Indizierung in eckigen Klammern für die Zeilenfilterung. Dieser Ansatz erfordert jedoch die vorherige Zuweisung des DataFrame zu einer Variablen, was unpraktisch sein kann.
Um diese Einschränkung zu beheben, haben einige Benutzer die Möglichkeit untersucht, Filterkriterien innerhalb des booleschen Indexes zu verketten. Zum Beispiel:
df[(df.A == 1) & (df.D == 6)]
Diese Syntax ermöglicht eine präzise und effiziente Filterung durch die Kombination mehrerer Bedingungen.
Wenn die gewünschte Funktionalität darin besteht, Methoden anstelle von Filterkriterien zu verketten, können Benutzer eine benutzerdefinierte Maske definieren Methode, die als Methoden-Wrapper für den zugrunde liegenden Filtervorgang dient.
def mask(df, key, value): return df[df[key] == value]
Durch Hinzufügen dieser Methode zur DataFrame-Klasse:
pandas.DataFrame.mask = mask
Benutzer können dann die Methodenverkettungsfunktionen von Pandas nutzen um mehrere Filtervorgänge in einer einzigen Codezeile auszuführen:
df.mask('A', 1).mask('D', 6)
Dieser Ansatz bietet eine anpassbare und flexible Lösung für die Verkettung von Filtervorgängen auf DataFrames.
Das obige ist der detaillierte Inhalt vonKann die Operatorverkettung für die DataFrame-Zeilenfilterung in Pandas verwendet werden?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!