Effiziente String-Manipulation in DataFrames
Das Manipulieren von Strings innerhalb eines DataFrames ist eine häufige Aufgabe in der Datenanalyse. In diesem Fall versuchen wir, unerwünschte Zeichen aus einer Spalte mit Zeichenfolgen zu entfernen.
Um dies zu erreichen, können wir den .str-Accessor verwenden. Wie Sie jedoch festgestellt haben, führt die direkte Anwendung von .str.lstrip(' -').rstrip('aAbBcC') zu einem Fehler. Dies liegt daran, dass die .str-Methoden eine einzelne Funktion als Argument erwarten.
Um dieses Problem zu lösen, können wir die .map-Funktion verwenden, um die folgende Lambda-Funktion auf jedes Element in der Spalte anzuwenden:
lambda x: x.lstrip('+-').rstrip('aAbBcC')
Diese Funktion entfernt die führenden Zeichen „ “ oder „-“ und die nachgestellten Zeichen „a“, „A“, „b“, „B“ oder „c“ aus jeder Zeichenfolge. Indem wir diese Funktion auf die Ergebnisspalte anwenden, erhalten wir die gewünschten gekürzten Werte.
Der folgende Codeausschnitt demonstriert die Lösung:
data['result'] = data['result'].map(lambda x: x.lstrip('+-').rstrip('aAbBcC'))
Das obige ist der detaillierte Inhalt vonWie entferne ich unerwünschte Zeichen effizient aus einer Zeichenfolgenspalte in einem DataFrame?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!