既然是去掉標點符號,那當然是用正規表示式啦。
正規表示式,又稱規則表達式。 (英文:Regular Expression,在程式碼中常簡寫為regex、regexp或RE),電腦科學的一個概念。正規表示式通常被用來檢索、取代那些符合某個模式(規則)的文字。 (推薦學習:Python影片教學)
正規表示式是對字串運算的一種邏輯公式,就是用事先定義好的一些特定字元、及這些特定字元的組合,組成一個“規則字串”,這個“規則字串”用來表達對字串的一種過濾邏輯。
給定一個正規表示式和另一個字串,我們可以達到如下的目的:
1. 給定的字串是否符合正規則表達式的過濾邏輯(稱為「匹配」):
2. 可以透過正規表示式,從字串中取得我們想要的特定部分。
可以將字串中的標點符號過濾,從而達到去掉或替換標點符號的效果。
import re punctuation = '!,;:?"\'' def removePunctuation(text): text = re.sub(r'[{}]+'.format(punctuation),'',text) return text.strip().lower() text = " Hello, world! " print removePunctuation(text)
正規表示式的特點是:
1.靈活性、邏輯性和功能性非常強;
2. 可以快速地用極簡單的方式達到字串的複雜控制。
3. 對於剛接觸的人來說,比較晦澀難懂。
更多Python相關技術文章,請造訪Python教學欄位學習!
以上是python中怎麼去掉標點符號的詳細內容。更多資訊請關注PHP中文網其他相關文章!