解码 Unicode 文本以进行文件写入
您在将 Unicode 文本写入文件时遇到编码问题。为了克服这个问题,尽可能多地处理 Unicode 对象是至关重要的。
编码 Unicode 字符串
当您的字符串是 Unicode 对象(由前缀“表示”时) u"(Python 中的 u"),在写入文件之前必须将其转换为 Unicode 编码的字符串。使用以下格式:
foo = u'Δ, Й, ק, م, ๗, あ, 叶, 葉, and 말.' f = open('test', 'w') f.write(foo.encode('utf8')) # Encode to UTF-8 f.close()
这可确保非 ASCII 字符在文件中正确编码。
读取期间解码
何时从编码文件中读取,您将获得一个 Unicode 编码的字符串。要检索 Unicode 对象,请将其解码:
f = file('test', 'r') print f.read().decode('utf8') # Decode from UTF-8
通过执行以下步骤,您可以在写入和读取文件时安全地处理 Unicode 文本,确保保留特殊字符和符号。
以上是如何在 Python 中写入和读取 Unicode 文本文件?的详细内容。更多信息请关注PHP中文网其他相关文章!