在Python 中從字串中剝離非字母數字字元
Python 提供了多種從字串中刪除非字母數字字元字串的方法。以下是幾個有效的方法:
1.使用列表理解和str.isalnum():
建立一個迭代字串中每個字元的列表理解。使用 str.isalnum() 檢查字元是否為字母數字,然後將字母數字字元連接成新字串。
<code class="python">cleaned_string = ''.join(ch for ch in string if ch.isalnum())</code>
2.使用filter() 和str.isalnum():
使用filter() 函數建立一個生成器,只從字串產生字母數字字元。然後,將這些字元連接成一個新字串。
<code class="python">cleaned_string = ''.join(filter(str.isalnum, string))</code>
3.使用re.sub() 和正規表示式:
建立符合所有非字母數字字元的正規表示式模式,例如「[ W_]」。然後,使用 re.sub() 將這些非字母數字字元替換為空字串。
<code class="python">import re cleaned_string = re.sub('[\W_]+', '', string)</code>
4.使用re.sub() 和預編譯正規表示式:
將正規表示式模式編譯為對象,以提高重複操作的效率。
<code class="python">import re pattern = re.compile('[\W_]+') cleaned_string = pattern.sub('', string)</code>
效能注意事項:
使用Python 的timeit 模組對各種方法進行基準測試表明,使用經過編譯的正則表達式和re.sub () 是處理大字串最有效的方法。
以上是如何從 Python 字串中刪除非字母數字字元?的詳細內容。更多資訊請關注PHP中文網其他相關文章!