Praktische Tipps zur Verwendung von Pandas zur Datenfilterung
Pandas ist eine leistungsstarke Datenverarbeitungsbibliothek, die in der Datenanalyse und Datenwissenschaft weit verbreitet ist. Die Datenfilterung ist eine häufige Aufgabe bei der Datenverarbeitung. In diesem Artikel wird die Verwendung von Pandas zur Datenfilterung vorgestellt und spezifische Codebeispiele bereitgestellt.
1. Daten basierend auf Bedingungen filtern
Pandas bietet eine Vielzahl von bedingten Operatoren zum Filtern von Daten basierend auf Bedingungen. Zu den häufig verwendeten Operatoren gehören gleich (==), ungleich (!=), größer als (>), kleiner als (=), kleiner als oder gleich (
Angenommen, es gibt ein DataFrame-Objekt df, das den Namen, das Alter und die Punktzahl der Schüler enthält. Wir können den folgenden Code verwenden, um Schülerdaten mit einer Punktzahl von mehr als oder gleich 90 Punkten herauszufiltern:
df_filtered = df[df['score'] >= 90]
Zusätzlich zu einer einzelnen Bedingung unterstützt Pandas auch die Verwendung mehrerer Bedingungen für die Datenfilterung. Bedingungen können mit den logischen Operatoren und, oder und nicht verknüpft werden.
Angenommen, wir möchten die Daten von Schülern herausfiltern, die zwischen 18 und 25 Jahre alt sind und eine Punktzahl von mindestens 80 Punkten haben. Sie können den folgenden Code verwenden:
df_filtered = df[(df['age'] >= 18) & (df['age'] <= 25) & (df['score'] >= 80)]
2. Filtern Sie die Daten basierend auf index
Das DataFrame-Objekt in Pandas wird standardmäßig automatisch generiert. Ein ganzzahliger Index kann zur Datenfilterung verwendet werden.
Sie können das iloc-Attribut verwenden, um Daten basierend auf dem Positionsindex von Zeilen und Spalten zu filtern.
Angenommen, wir möchten beispielsweise die Daten aus den Zeilen 2 bis 5 herausfiltern, können Sie den folgenden Code verwenden:
df_filtered = df.iloc[2:6, :]
Wenn der Label-Index im DataFrame-Objekt festgelegt ist, Sie Sie können das loc-Attribut verwenden, um Daten basierend auf dem Tag-Index zu filtern.
Angenommen, wir möchten die Daten von Schülern herausfiltern, die 20 Jahre oder älter sind, können Sie den folgenden Code verwenden:
df_filtered = df.loc[df['age'] >= 20, :]
3 Filtern Sie Daten basierend auf Feldern
Zusätzlich zum Filtern mithilfe von Bedingungen und Indizes. Sie können Daten auch nach Feldern filtern.
Sie können Spaltennamen verwenden, um bestimmte Spaltendaten herauszufiltern.
Angenommen, wir möchten beispielsweise nur die Daten in den beiden Spalten Name und Noten herausfiltern, können Sie den folgenden Code verwenden:
df_filtered = df[['name', 'score']]
Sie können den Wert von verwenden Feld, um die dem Feldwert entsprechenden Daten herauszufiltern.
Angenommen, wir möchten Schülerdaten mit Werten zwischen 80 und 90 Punkten herausfiltern, können wir den folgenden Code verwenden:
df_filtered = df[df['score'].between(80, 90)]
Das Obige sind praktische Tipps für die Verwendung von Pandas zur Datenfilterung durch die flexible Verwendung von Bedingungen, Indizes und Felder können Sie ganz einfach die benötigten Daten herausfiltern. Ich hoffe, dieser Artikel wird Ihnen bei Ihrem Datenverarbeitungsprozess helfen!
Das obige ist der detaillierte Inhalt vonPraktische Tipps und Beispiele zur Pandas-Datenfilterung. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!