Effizientes Bereinigen von DataFrame-Spaltenzeichenfolgen
Das Entfernen unerwünschter Teile aus Zeichenfolgen in einer DataFrame-Spalte ist eine häufige Aufgabe bei der Datenbereinigung. Dies kann das Entfernen bestimmter Zeichen, Präfixe oder Suffixe erfordern.
Betrachten Sie einen DataFrame mit der folgenden Datenstruktur:
Time | Result |
---|---|
09:00 | 52A |
10:00 | 62B |
11:00 | 44a |
12:00 | 30b |
13:00 | -110a |
Unser Ziel ist es, den numerischen Teil aus jedem „Ergebnis“ zu extrahieren ' Zeichenfolge, wobei die Zeichen „ “ und „-“ sowie die nachgestellten Zeichen entfernt werden. Die gewünschte Ausgabe sollte so aussehen:
Time | Result |
---|---|
09:00 | 52 |
10:00 | 62 |
11:00 | 44 |
12:00 | 30 |
13:00 | 110 |
Um dies zu erreichen, können wir die Lambda-Funktion von Python nutzen. Der folgende Code bereinigt effektiv die Daten der Spalte „Ergebnis“:
data['Result'] = data['Result'].map(lambda x: x.lstrip('+-').rstrip('aAbBcC'))
Diese Lambda-Funktion durchläuft jedes Element in der Spalte „Ergebnis“:
Durch die Anwendung dieser Operationen erreichen wir das gewünschte Ergebnis, indem unerwünschte Teile aus den Zeichenfolgen in der Spalte „Ergebnis“ entfernt werden.
Das obige ist der detaillierte Inhalt vonWie bereinige ich DataFrame-Spaltenzeichenfolgen effizient mit der Lambda-Funktion von Python?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!