解碼 Unicode 文字以進行檔案寫入
您在將 Unicode 文字寫入檔案時遇到編碼問題。為了克服這個問題,盡可能處理 Unicode 物件是至關重要的。
編碼Unicode 字串
當您的字串是Unicode 物件(由前綴「表示」時) u"(Python 中的u"),在寫入入文件之前必須將其轉換為Unicode 編碼的字串。使用以下格式:
foo = u'Δ, Й, ק, م, ๗, あ, 叶, 葉, and 말.' f = open('test', 'w') f.write(foo.encode('utf8')) # Encode to UTF-8 f.close()
這可確保非 ASCII 字元在檔案中正確編碼。
讀取期間解碼
何時從編碼檔案中讀取,您將獲得一個 Unicode 編碼的字串。若要檢索 Unicode 對象,請將其解碼:
f = file('test', 'r') print f.read().decode('utf8') # Decode from UTF-8
透過執行下列步驟,您可以在寫入和讀取檔案時安全地處理 Unicode 文本,確保保留特殊字元和符號。
以上是如何在 Python 中寫入和讀取 Unicode 文字檔案?的詳細內容。更多資訊請關注PHP中文網其他相關文章!