在Python Unicode 字串中刪除重音(標準化)
從Unicode 字串中刪除重音(變音符號)涉及將其轉換為長標準化形式,其中字母和變音符號具有單獨的字元。隨後,刪除變音符號以獲得所需的規範化字串。
使用Python標準函式庫
不幸的是,Python標準函式庫並沒有提供直接的重音解決方案Unicode 字串中的刪除。不過,您可以使用 unicodedata 模組來取得字元資訊並相應地修改字串。
使用第三方函式庫
為了更方便、更全面的解決方案,第三種- 可以使用像 pyICU 這樣的第三方函式庫。以下是使用 unidecode 的範例:
import unidecode accented_string = 'kožušček' normalized_string = unidecode.unidecode(accented_string) print(normalized_string) # Output: 'kozuscek'
實作詳細資訊
unidecode 將 Unicode 字元轉寫為其最接近的 ASCII 等效項。它利用廣泛的映射表將重音字元轉換為其基本形式。與明確映射方法不同,它可以處理各種 Unicode 字符,包括那些不常用的字符。
以上是如何在 Python 中刪除 Unicode 字串中的重音符號?的詳細內容。更多資訊請關注PHP中文網其他相關文章!