Filtern von Zeilen in Pandas-DataFrames mit Operatorverkettung
Die Flexibilität von Pandas-Operationen ermöglicht eine bequeme Verkettung zur Durchführung von Datenmanipulationsaufgaben. Allerdings war zum Filtern von Zeilen traditionell eine manuelle Klammerindizierung erforderlich, was umständlich sein kann.
Verkettete boolesche Indizierung
Die einfachste Möglichkeit, Zeilen mithilfe der Operatorverkettung zu filtern, ist das Erstellen eine boolesche Maske und Indizieren des DataFrame damit:
<code class="python">df_filtered = df[df['column'] == value]</code>
Die boolesche Maske prüft den Wert jeder Zeile für die angegebene Spalte und gibt True für übereinstimmende Zeilen zurück.
Verkettung benutzerdefinierter Maskenmethoden
Alternativ können Sie die DataFrame-Klasse mit einer benutzerdefinierten Maskierungsmethode erweitern:
<code class="python">def mask(df, key, value): return df[df[key] == value] pandas.DataFrame.mask = mask</code>
Diese Methode verwendet einen DataFrame, einen Spaltennamen und einen Wert als Parameter und maskiert zeilenbasiert selektiv nach dem angegebenen Kriterium.
<code class="python">df_filtered = df.mask('column', value)</code>
Verkettung mehrerer Masken
Die Filterung mit verketteten Operatoren ermöglicht komplexe Kriterien durch die Kombination mehrerer Masken:
<code class="python">df_filtered = df[ (df['column1'] == value1) & (df['column2'] == value2) & ... ]</code>
Zusammenfassend bietet Pandas zwei Hauptmethoden für die Filterung verketteter Zeilen:
Das obige ist der detaillierte Inhalt vonWie können Sie Zeilen in Pandas-DataFrames mit Operatorverkettung filtern?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!