python中文编码问题小结-Tutoriel Python-php.cn

中文编码问题一直是Python程序设计中很头痛的问题，本文对此较为详细的进行了总结归纳。具体如下：

当字符串是：'\u4e2d\u56fd'

>>>s=['\u4e2d\u56fd','\u6e05\u534e\u5927\u5b66']
>>>str=s[0].decode('unicode_escape') #.encode("EUC_KR")
>>>print str
中国

Copier après la connexion

当字符串是:' 东亚学团一中'

>>>print unichr(19996)
东

Copier après la connexion

ord()支持unicode，可以显示特定字符的unicode号码，如：

>>>print ord('A')
65

Copier après la connexion

只要和Unicode连接，就会产生Unicode字串。如：

>>> 'help'
'help'
>>> 'help，' + u'python'   
u'help，python'

Copier après la connexion

对于ASCII(7位)兼容的字串，可和内置的str()函数把Unicode字串转换成ASCII字串。如：

>>> str(u'hello world')
'hello world'

Copier après la connexion

对几个概念的理解：

ASCII码用数据字对应相应的字符如下图所示：

而中文就是区位码对应汉字。如：“好” 的ASCII码为： 22909

unicode 编码每个国家分一块。它有UTF-8、UTF-16、UTF-32等形式
中文范围 4E00-9FBF：这个范围内有 gbk,gb2312,

utf-8是基于unicode的国际化的场合适合使用

gb2312和gb2312都是国标码出现的较早主要用于编解码常用汉字

希望本文所述对大家的Python程序设计有所帮助。

Étiquettes associées：

python 中文编码

Article précédent：跟老齐学Python之不要红头文件(1) Article suivant：python自动化测试之连接几组测试包实例

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Derniers articles par auteur