Entfernen nicht-alphanumerischer Zeichen aus Zeichenfolgen in Python
Python bietet mehrere Ansätze zum Entfernen nicht-alphanumerischer Zeichen aus Zeichenfolgen. Hier sind mehrere wirksame Methoden:
1. Verwenden von Listenverständnis und str.isalnum():
Erstellen Sie ein Listenverständnis, das jedes Zeichen in der Zeichenfolge durchläuft. Verwenden Sie str.isalnum(), um zu überprüfen, ob das Zeichen alphanumerisch ist, und fügen Sie dann die alphanumerischen Zeichen zu einer neuen Zeichenfolge zusammen.
<code class="python">cleaned_string = ''.join(ch for ch in string if ch.isalnum())</code>
2. Verwenden von filter() und str.isalnum():
Verwenden Sie die Funktion filter(), um einen Generator zu erstellen, der nur die alphanumerischen Zeichen aus der Zeichenfolge liefert. Fügen Sie diese Zeichen dann zu einer neuen Zeichenfolge zusammen.
<code class="python">cleaned_string = ''.join(filter(str.isalnum, string))</code>
3. Verwenden von re.sub() und regulären Ausdrücken:
Erstellen Sie ein reguläres Ausdrucksmuster, das allen nicht alphanumerischen Zeichen entspricht, z. B. „[W_]“. Verwenden Sie dann re.sub(), um diese nicht alphanumerischen Zeichen durch eine leere Zeichenfolge zu ersetzen.
<code class="python">import re cleaned_string = re.sub('[\W_]+', '', string)</code>
4. Verwenden von re.sub() und einem vorkompilierten regulären Ausdruck:
Kompilieren Sie das reguläre Ausdrucksmuster als Objekt, um die Effizienz für wiederholte Vorgänge zu verbessern.
<code class="python">import re pattern = re.compile('[\W_]+') cleaned_string = pattern.sub('', string)</code>
Überlegungen zur Leistung :
Das Benchmarking verschiedener Methoden mit dem Timeit-Modul von Python zeigt, dass die Verwendung eines kompilierten regulären Ausdrucks mit re.sub() der effizienteste Ansatz für große Strings ist.
Das obige ist der detaillierte Inhalt vonWie entferne ich nicht-alphanumerische Zeichen aus Zeichenfolgen in Python?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!