在Python 原始碼中使用UTF-8 編碼
在某些情況下,使用時可能會遇到與非ASCII 字元相關的錯誤Python 原始碼中的Unicode 字串。這是因為 Python 2 原始檔的預設編碼不是 UTF-8。
聲明 UTF-8 字串
在 Python 3 中,UTF-8 是預設值來源編碼,因此可以直接使用Unicode字符,無需任何特殊聲明。但是,在 Python 2 中,您需要使用以下語法在原始檔案頭中明確聲明 UTF-8 編碼:
# -*- coding: utf-8 -*-
將此行放在 Python 2 原始檔的開頭。
例如,考慮以下 Python 2 代碼:
<code class="python"># -*- coding: utf-8 -*- u = 'idzie wąż wąską dróżką' uu = u.decode('utf8') s = uu.encode('cp1250') print(s)</code>
此代碼使用 UTF-8 編碼並成功將 Unicode 字串轉換為 CP1250 編碼的位元組字串以進行列印。
透過聲明 UTF-8 編碼,可以確保 Python 正確解釋 Unicode 字元並避免與非 ASCII 字元相關的錯誤。請務必注意,此聲明必須放置在原始檔案的開頭,任何其他程式碼之前。
以上是如何在 Python 2 原始碼中使用 UTF-8 編碼?的詳細內容。更多資訊請關注PHP中文網其他相關文章!