Filtern eines Pandas-DataFrames nach Teilstring-Kriterien
Angenommen, Sie haben einen DataFrame mit einer Spalte, die String-Werte enthält. Möglicherweise müssen Sie Zeilen basierend auf teilweisen Zeichenfolgenübereinstimmungen auswählen, ähnlich wie bei der Verwendung des Idioms re.search(pattern, cell_in_question) in regulären Ausdrücken. Obwohl Sie mit der Syntax df[df['A'] == "hello world"] vertraut sind, kann es schwierig sein, einen Weg zu finden, dies für partielle Zeichenfolgenübereinstimmungen wie „hello“ zu erreichen.
Die Lösung liegt in der Verwendung vektorisierter String-Methoden, insbesondere Series.str. Mit diesem Ansatz können Sie den folgenden Vorgang ausführen:
df[df['A'].str.contains("hello")]
Diese Codezeile gibt die Teilmenge der Zeilen im DataFrame zurück, die die Teilzeichenfolge „hello“ in der Spalte „A“ enthalten. Es ist wichtig zu beachten, dass diese Funktion in Pandas Version 0.8.1 und nachfolgenden Versionen verfügbar ist.
Das obige ist der detaillierte Inhalt vonWie kann ich einen Pandas-DataFrame basierend auf Teilstring-Übereinstimmungen filtern?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!