在 Python 源代码中声明 UTF-8 字符串
考虑 Python 2 中的以下代码:
<code class="python">u = unicode('d…') s = u.encode('utf-8') print s</code>
运行此代码时,由于源代码中存在非 ASCII 字符,会引发语法错误。要解决此问题,必须在源代码标头中声明 UTF-8 编码:
<code class="python"># -*- coding: utf-8 -*- ....</code>
此声明通知 Python 对源文件使用 UTF-8 编码。一旦声明,UTF-8 字符就可以在代码中的任何位置使用。例如:
<code class="python"># -*- coding: utf-8 -*- u = 'idzie wąż wąską dróżką' uu = u.decode('utf8') s = uu.encode('cp1250') print(s)</code>
在 Python 3 中,UTF-8 是默认的源编码,因此无需任何特殊声明即可使用 Unicode 字符。
以上是如何在 Python 源代码中声明 UTF-8 字符串?的详细内容。更多信息请关注PHP中文网其他相关文章!