Rumah > pembangunan bahagian belakang > Tutorial Python > 分享一个用python遍历字符串(含汉字)的方法

分享一个用python遍历字符串(含汉字)的方法

Y2J
Lepaskan: 2017-05-02 15:01:50
asal
2049 orang telah melayarinya

这篇文章主要介绍了python 遍历字符串(含汉字)实例详解的相关资料,需要的朋友可以参考下

python 遍历字符串(含汉字)实例详解

s = "中国china"
for j in s:
  print j
Salin selepas log masuk

首先一个,你这个'a'是什么编码?可能不是你所想的gbk

>>> a='中国'
>>> a
Salin selepas log masuk

这样试试看,如果出来是6个字(word),说明是utf-8,如果是4个字,说明gbk。

另外,不管是utf-8还是gbk,都不能这样遍历,因为这里它会一个字一个字拿出来。虚拟机把a当成一个长度为len(a)的字符串了。

接下来是遍历问题。

Linux的shell大都默认是utf-8,所以一个中文字符是三个字,所以要三个三个地读,你可以试下:

>>> a[:3]
Salin selepas log masuk

出来就是个”中”字

windows的command的默认是cp936,也就是gbk,一个中文字符是两个字,所以两个字两个字地读(a[:2])。

还有另一种遍历的方法,把字符串转换成unicode,这样中文英文都是一个字,就可以用你的for i in a的方法遍历了。这个的好处是中文英文字符都是一个字,而utf-8和gbk里,英文字母只占一个字。

s = u"中国china"
for j in s:
  print j
Salin selepas log masuk

输出如下:

中
国
c
h
i
n
a
Salin selepas log masuk

Atas ialah kandungan terperinci 分享一个用python遍历字符串(含汉字)的方法. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Label berkaitan:
sumber:php.cn
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan