Unerwünschte Zeichen aus Zeichenfolgen in DataFrame-Spalten entfernen
Beim Umgang mit Datensätzen, die Zeichenfolgendaten enthalten, ist es häufig erforderlich, aussagekräftige Informationen daraus zu extrahieren Saiten. Allerdings können unerwünschte Zeichen oder Formatierungen die gewünschten Daten verdecken. In diesem Szenario besteht das Ziel darin, diese unerwünschten Teile effizient zu entfernen.
Angenommen, wir haben eine DataFrame-Spalte mit den folgenden Daten:
time | result |
---|---|
09:00 | 52A |
10:00 | 62B |
11:00 | 44a |
12:00 | 30b |
13:00 | -110a |
Unser Ziel ist es, die Daten zu kürzen, um die zu entfernen ' ' oder '-' Präfix und das Suffix 'a' oder 'b'. Die gewünschte Ausgabe ist:
time | result |
---|---|
09:00 | 52 |
10:00 | 62 |
11:00 | 44 |
12:00 | 30 |
13:00 | 110 |
Um dies zu erreichen, verwenden wir die Lambda-Funktion innerhalb der Map-Methode. Der folgende Codeausschnitt erledigt die Aufgabe:
data['result'] = data['result'].map(lambda x: x.lstrip('+-').rstrip('aAbBcC'))
Die lstrip-Funktion entfernt alle führenden „ “ oder „-“-Zeichen, während die rstrip-Funktion alle nachgestellten „a“, „A“, „b“ usw. entfernt. „B“- oder „c“-Zeichen. Die Ausgabe ist ein DataFrame mit den gewünschten zugeschnittenen Daten.
Das obige ist der detaillierte Inhalt vonWie entferne ich unerwünschte Zeichen aus Zeichenfolgenspalten in einem DataFrame?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!