本文实例讲述了在windows命令窗口下执行Python文件产生乱码的问题, 供大家参考:
Ps: 如有错误还请指正, 欢迎交流学习
# -*- coding:utf-8 -*-str = "彦雪"print str
执行后, 输出结果如下:
褰﹂洩
乱码结果和大家可能不同, 不过也都是乱码啦!!
Python2 默认编码为 "ascii", ascii编码不包含中文字符
如果在其中有中文字符的话, Python解释器一般会报错.
但如果指定了以UTF-8 编码, Python就不再报错.
"# -- coding:utf-8 --" 是指定Python源码以 UTF-8 编码。
window默认编码为gbk编码,所以str输出前必须编码为gbk。
由于Python中不允许直接将将utf-8 转为gbk, 因此需要先将utf-8 转为unicode 再转为gbk
这种方法有一种弊端 就是当我们在跨平台的时候就会出现问题, 因此Python 为我们提供了一个方便的解决方案使用 unicode 作为输出 -- 此方法不适用于raw_input
当需要打印输出时,Python 会首先调取字符输出程序(命令行或者输出函数)的编码格式,然后将该字符串编码成字符输出程序所用的编码(这样字符输出程序就不会因为认不出编码而出现乱码),接着字符输出程序将编码后的字符输出到目的地。
# 方法一 中文前加u, 告诉Python解释器后面的是个unicode编码str = u"彦雪"
# 方法二 str.decode('utf-8') 以utf-8编码对字符串 str 进行解码, 获取unicodestr = "彦雪".decode('utf-8')
# 方法三 unicode(str, 'utf-8') 将字符串 str 以utf-8编码解码, 获取unicodestr = unicode('彦雪','utf-8')
使用raw_input 需要将中文转换为系统编码, 方法如下列所示
# 方法1 str.encode("gbk") 将unicode转为gbk 编码content = raw_input(u"输入内容: ".encode("gbk"))
# 方法2content = raw_input("输入内容: ".decode('utf-8').encode("gbk"))
# 方法3content = raw_input(unicode('输入内容: ','utf-8').encode("gbk"))
虽然这种写法很方便, 但是跨平台效果较差, 个人不推荐这种写法, 建议中文字符和raw_input 分开写. 通过其他手段达到在同一行的目的
Python的编码注释# -- coding:utf-8 --
PEP 263 -- Defining Python Source Code Encodings
关于Python的编码、乱码以及Unicode的一些研究
raw_input输入、文件读取、变量比较等str、unicode、utf-8转换问题
目前离职, 在等待的过程中, 分享下以前经常遇到的问题和大家探讨, 希望对大家有所帮助, 欢迎指正
在分享知识中寻找自我,享受编程之乐
Atas ialah kandungan terperinci Python2.7 在windows命令窗口 输出中文乱码. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!