Python 中的Unicode 調試:刪除xa0 不間斷空格
使用Beautiful Soup 解析HTML 並存取文字內容時(使用文字內容) ),很常見的是Unicode 字元xa0,代表不間斷空格。若要有效刪除這些空格並將其替換為Python 2.7 中的常規空格,請依照下列步驟操作:
匯入unicodedata 模組:
<code class="python">import unicodedata</code>
利用unicodedata.normalize() 刪除Unicode 格式:
<code class="python">text = unicodedata.normalize('NFKD', text)</code>
用常規空格取代不間斷空格:
<code class="python">text = text.replace(u'\xa0', ' ')</code>
以上是如何在 Python 中刪除文字中的 \xa0 不間斷空格?的詳細內容。更多資訊請關注PHP中文網其他相關文章!