python中文编码问题小结-Python-Tutorial-php.cn

中文编码问题一直是Python程序设计中很头痛的问题，本文对此较为详细的进行了总结归纳。具体如下：

当字符串是：'\u4e2d\u56fd'

>>>s=['\u4e2d\u56fd','\u6e05\u534e\u5927\u5b66']
>>>str=s[0].decode('unicode_escape') #.encode("EUC_KR")
>>>print str
中国

Nach dem Login kopieren

当字符串是:' 东亚学团一中'

>>>print unichr(19996)
东

Nach dem Login kopieren

ord()支持unicode，可以显示特定字符的unicode号码，如：

>>>print ord('A')
65

Nach dem Login kopieren

只要和Unicode连接，就会产生Unicode字串。如：

>>> 'help'
'help'
>>> 'help，' + u'python'   
u'help，python'

Nach dem Login kopieren

对于ASCII(7位)兼容的字串，可和内置的str()函数把Unicode字串转换成ASCII字串。如：

>>> str(u'hello world')
'hello world'

Nach dem Login kopieren

对几个概念的理解：

ASCII码用数据字对应相应的字符如下图所示：

而中文就是区位码对应汉字。如：“好” 的ASCII码为： 22909

unicode 编码每个国家分一块。它有UTF-8、UTF-16、UTF-32等形式
中文范围 4E00-9FBF：这个范围内有 gbk,gb2312,

utf-8是基于unicode的国际化的场合适合使用

gb2312和gb2312都是国标码出现的较早主要用于编解码常用汉字

希望本文所述对大家的Python程序设计有所帮助。

Verwandte Etiketten：

python 中文编码

Vorheriger Artikel：跟老齐学Python之不要红头文件(1) Nächster Artikel：python自动化测试之连接几组测试包实例

Erklärung dieser Website

Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Neueste Artikel des Autors