masyarakat

Belajar

Perpustakaan Alatan

Alat AI

Masa lapang

Melayu

Rumah > pembangunan bahagian belakang > Tutorial Python > Python 中文乱码

Python 中文乱码

巴扎黑

Lepaskan： 2016-12-07 10:41:19

asal

1244 orang telah melayarinya

开始接触python脚本，一上来就碰到了中文乱码问题。

结合网上的资料，现整理下：

字符串在Python内部的表示是unicode编码，因此，在做编码转换时，通常需要以unicode作为中间编码，即先将其他编码的字符串解码（decode）成unicode，再从unicode编码（encode）成另一种编码。

decode 解码,作用是将其他编码的字符串转换成unicode编码，如str1.decode('gb2312')，表示将gb2312编码的字符串str1转换成unicode编码。

encode 编码,作用是将unicode编码转换成其他编码的字符串，如str2.encode('gb2312')，表示将unicode编码的字符串str2转换成gb2312编码。

如果一个字符串已经是unicode了，再进行解码则将出错，因此通常要对其编码方式是否为unicode进行判断：

isinstance(s, unicode) #用来判断是否为unicode

用非unicode编码形式的str来encode会报错

如何获得系统的默认编码？

#!/usr/bin/python

#coding=utf-8

import sys

print sys.getdefaultencoding()

该段程序在英文WindowsXP上输出为：ascii

在某些IDE中，字符串的输出总是出现乱码，甚至错误，其实是由于IDE的结果输出控制台自身不能显示字符串的编码，而不是程序本身的问题。

如在UliPad中运行如下代码：

s=u"中文" #指定为Unicode编码

print s

会提示：UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-1: ordinal not in range(128)。这是因为UliPad在英文WindowsXP上的控制台信息输出窗口是按照ascii编码输出的（英文系统的默认编码是ascii），而上面代码中的字符串是Unicode编码的，所以输出时产生了错误。

将最后一句改为：print s.encode('gb2312')

则能正确输出“中文”两个字。

若最后一句改为：print s.encode('utf8')

则输出：\xe4\xb8\xad\xe6\x96\x87，这是控制台信息输出窗口按照ascii编码输出utf8编码的字符串的结果。

unicode(str,'gb2312')与str.decode('gb2312')是一样的，都是将gb2312编码的str转为unicode编码

使用str.__class__可以查看str的编码形式

原理说了半天，上代码：

#coding=utf-8

#!/usr/bin/python

s="中文"

if isinstance(s, unicode):

print s.encode('gb2312')

else:

print s.decode('utf-8').encode('gb2312')

Label berkaitan：

python Python 中文乱码

Artikel sebelumnya：JAVA调python脚本 Artikel seterusnya：python 列表list去重

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Artikel terbaru oleh pengarang

如何给php数组添加元素

2023-03-14 15:58:02
实例展示JS实现简单的选择题测评系统

1970-01-01 08:00:00
PHP限制相同IP多次提交的解决办法

2023-03-15 07:38:01
HTML中用正则表达式实现表格验证

1970-01-01 08:00:00
有关JavaScript严格模式下this的指向问题详解

1970-01-01 08:00:00
Java构建树形菜单（包括多级菜单）的实例代码

1970-01-01 08:00:00
CSS3实现hover离开时平滑过渡的实例详解

1970-01-01 08:00:00
Swiper轮播图源码分享解析

1970-01-01 08:00:00
总结整理VsCode插件

1970-01-01 08:00:00
HttpUtils请求工具类的代码

1970-01-01 08:00:00

Isu terkini

python3.x - Apabila menggunakan perintah mula kelompok untuk menjalankan skrip Python yang ditentukan, selagi laluan atau nama skrip Python mengandungi aksara Cina, ia tidak boleh dilaksanakan Bagaimana untuk menyelesaikannya?

daripada 1970-01-01 08:00:00

0

0

0

javascript - Sila beritahu saya tentang masalah menukar fungsi panggil balik jq untuk menjanjikan pelaksanaan

daripada 1970-01-01 08:00:00

0

0

0

javascript - Kekeliruan tentang menghantar parameter dalam tindak balas

daripada 1970-01-01 08:00:00

0

0

0

javascript - gambar rajah tindanan atribut js

daripada 1970-01-01 08:00:00

0

0

0

javascript - aplikasi halaman tunggal angularjs Bagaimana untuk menyelesaikan masalah tidak menatal ke bahagian atas halaman selepas halaman menatal ke bawah dan navigasi melompat ke halaman baharu?

daripada 1970-01-01 08:00:00

0

0

0

Topik-topik yang berkaitan

Lagi>

Cadangan popular

Tutorial Popular

Lagi>

Tutorial berkaitan

Cadangan popular

Kursus terkini

Muat turun terkini

Lagi>

kesan web

Kod sumber laman web

Bahan laman web

Templat hujung hadapan