Python中关于字符编码与函数的使用详解-Tutorial Python-php.cn

Rumah

pembangunan bahagian belakang

Tutorial Python

Python中关于字符编码与函数的使用详解

黄舟

Oct 02, 2017 am 09:42 AM

python fungsi pengekodan

下面小编就为大家带来一篇Python字符编码与函数的基本使用方法。小编觉得挺不错的，现在就分享给大家，也给大家做个参考。一起跟随小编过来看看吧

一、Python2中的字符存在的解码编码问题

如果是现在正在用Python2的人应该都知道存在字符编码问题，就举一个最简单的例子吧：Python2是无法在命令行直接打印中文的，当然他也是不会报错的，顶多是一堆你看不懂的乱码。如果想在直接显示中文，我们是可以在Python2文件头部申明字符编码的格式。如下图

这里 #-*-coding:utf-8 -*- 是用来申明下面的代码是用什么编码来解释；

1.1.Python2中的解码和编码：

在编码和解码的世界中，我们得需要找一个大家都知道的文字。也可以这么理解。我是一个中国人现在和一个日本人沟通，我肯定是无法理解他说的是什么，他同样也无法理解，但是这样就没有办法了吗？或许我们需要一个国际的语言——英语。这样来自不同国家的人也可以进行沟通了（虽然我知道 are you ok 0-0）。在编码中也是一样，gbk和utf-8都不知道对方的格式是什么吊意思。所以如果要上gbk读懂utf-8的编码就得将utf-8 decode成 Unicode，而Unicode有知道gkb，这里需要将Unicode在encode成gbk就行了

#-*- coding:utf-8 -*-


msg = "中国"
print msg

#解码在编码的过程，encoding是申明用申明这段代码是什么编码
gbk_str = msg.decode(encoding=&#39;utf-8&#39;).encode(encoding=&#39;gbk&#39;)
print gbk_str

#其实两种输出的结果是一样的

Salin selepas log masuk

在Python2中默认是使用gbk来解释IDE中的代码的，所以无法直接在Python命令行中直接输入中文，所以我们才会使用 #-*-coding:utf-8 -*-来申明头部，我们到底需要使用什么语言来解释下面代码。细心的人肯定是发现了一个问题，申明头部只是使用utf-8来解释下面的话，按理说命令行中虽然不报错，但是应该也是乱码才是，这里为啥会直接输出中文呢毕竟DOS命令行中默认支持的是gbk格式的字符代码呀？这里就涉及到另外的一个概念了。Python到内存解释器里面，默认是用的Unicode，文件加载到内存后自动解码成Unicode，而Unicode是外国码，自然也就可以翻译来自utf-8的编码，也可以翻译成gbk的编码了。顾可以显示中文了。

PS：这里我们得出一个结论：python2 中解码动作是必须的，但是编码可以不用，因为内存就是Unicode

1.2、Python3中字符编码的问题：

额，这还有什么可以说的呢？Python3默认就是使用utf-8解释代码的。也就是行首自带 #-*-coding:utf-8 -*-（GBM），所以也就不存在解码的问题。但是我在这里提上一嘴（其实就是怕自己以后也忘了，嘿嘿），如果我们将utf-8的字符编码的格式给编码成gbk。这里会输出bytes格式的东西。

bytes到底是什么东西呢？这里我简单的说一下。其实就是这个字符在ASCII码中对应的位置。不信，我们通过一段代码截图看看:

在这一幅图中我们看到中国被传成了一堆看不懂的鸟文。而英文还是显示出来了。但是我们通过列表的截取，看出最后一位的c输出的是99，其实这里输出的就是ASCII中c对应的位置，而3个bytes是一个中文，所以我们看到了6段鸟文字，这里我们就不过多解释了。

PS：大家得记得一个东西就是：Python2 里面的str 就是Python3中的bytes格式，而Python2中的str其实就是Unicode

二、Python3对文件操作补充

2.1、带“+”的文件操作：

在这里我会说三个，但是其实这些东西都没有什么鸟用，只是这算上一个知识点

r+：可读，可以追加
w+：清空源文件，再写入新内容
a+：追加，可以读

f = open(&#39;lyrics&#39;,&#39;r+&#39;,encoding=&#39;utf-8&#39;) #这里的lyrics是文件名字
f.read() #我先读取 
f.write("Leon Have Dream") #在后面追加
f.close()

Salin selepas log masuk

r+：如果是先f.read()再f.write()就是在文件的结尾追加，如果是直接f.write()就直接将文件开始的内容替换成()中的内容；

f = open(&#39;lyricsback&#39;,&#39;w+&#39;,encoding=&#39;utf-8&#39;)
f.read()
f.write("Leon Have Dream")
f.read()
f.close()

Salin selepas log masuk

w+：其实就是清空内容再重新写入write()中的内容，并且f.read()也不会报错，个人建议可以在快要离职的时候执行这个操作

f = open(&#39;lyricsback&#39;,&#39;a+&#39;,encoding=&#39;utf-8&#39;)
f.read()
f.write("Leon Have A Draem")
f.read()
f.close()

Salin selepas log masuk

a+：其实和r+非常相似是在结尾中追加内容，可读内容

PS：这里的补充一下，为什么在使用r+的时候先执行f.read()再执行f.write()就会在文件的结尾追加和直接使用f.write()直接就替换文件最前边的内容呢？这是因为Python在读文件的时候自己维护这一个“指针”，如果我们使用f.read()就相当于读完了这个文件，这时候指针也就会在最后面了。下面我在补充“f”这个对象的几个用法来证明Python文件指针。

f = open(&#39;lyricsback&#39;,&#39;r+&#39; ,encoding=&#39;utf-8&#39;)
print(f.tell()) #this number is 0
f.seek(12) # 将指针向后面移动几个字节，一个汉字是三个字节
print(f.tell()) # this is seek number
f.write("Love Girl") #这里就从seek到地方替换
print(f.tell()) # tell()用法就是文件的指针位置
f.close()

Salin selepas log masuk

2.2、加b的方式对文件进行操作

rb：将文件以二进制的方式从硬盘中读取出来，这里得记住在open()函数中不要加encoding= 这个参数因为二进制不存在编码上的问题

wb:将文件以二进制的方式写入内容，不过在f.write()中加上encode="utf-8"，意思就是申明编码的格式，并且会清楚原来文件内容

ab：只能以二进制方式追加。

三、函数

什么是函数？函数可以简单理解一段命令的集合。为什么需要用函数？这里有一个非常简单的原因，比如说你需要对一段代码反复进行操作，这里你当然可以一直复制再粘贴，但是这样灵活性和日后的维护成本将会变大。

#比方说现在需要写一个报警（调用接口）的程序，这里就用监控做比喻

if cpu > 80%:
 连接邮箱服务器
 发送消息
 关闭连接

if memery > 80%:
 连接邮箱服务器
 发送消息
 关闭连接

if disk > 80%
 连接邮箱服务器
 发送消息
 关闭连接

#通过写这样的一个程序我们发现我们一直在重复调用发送邮箱的这一套接口。这样我们是否能想出一个办法解决这样的重复操作呢？请看下一个版本


发送邮件():
 l连接邮箱服务器
 发送连接
 关闭连接


if cpu > 80%
 发送邮件()

if memery > 80%:
 发送邮件()

....... # 这样以此类推，我们只需要挑用发送邮件的这个接口就可以节省代码的发送邮件了

Salin selepas log masuk

通过上面的代码我们发现，我们只需要将报警的这一套流程放到一个公共的地方，等下面触发报警的条件的时候调用报警的函数，这样我们就可以省去当每次触发报警的时候我们自己在写报警的步骤了。但是函数是怎么定义呢？又有什么语法和定义呢？请看下面的一段代码，其中代码输出的是“Leon Have A Dream”

def leon(): #leon是函数名字
 print("Leon Have A Dream")

leon() #调用函数

Salin selepas log masuk

带参数的函数：

a = 10
b = 5

def calc(a,b): 
 print(a ** b)

c = calc(a,b)
print(c)

Salin selepas log masuk

首先上面这些代码执行完会输出两个字符，一个是10000，一个是None，为什么会这样呢？首先c是等于执行了一遍calc这个函数，所以输出10000这个数字是肯定的，但是为什么还会输出一个None呢？原来我们的“c”执行了仪表calc函数，而calc函数中没有任何的返回值，所以c == None 。

PS：函数的返回结果就是return，其中return的含义就是：把函数的执行结果返回给外面，从而让挑用函数的“对象”得到执行结果

下面我们在看与之相似的列子

a = 10
b = 5

def calc(a,b):
 print(a ** b)

 return a + b

c = calc(a,b)
c = calc(10,6)
print(c)

Salin selepas log masuk

首先会输出的有三个值，分别是100000,1000000,16，为什么会是这三个呢，下面用一副图来说一下

PS：

形参变量只有在被调用时才分配内存单元，在调用结束时，即刻释放所分配的内存单元。因此，形参只在函数内部有效。函数调用结束返回主调用函数后则不能再使用该形参变量

实参可以是常量、变量、表达式、函数等，无论实参是何种类型的量，在进行函数调用时，它们都必须有确定的值，以便把这些值传送给形参。因此应预先用赋值，输入等办法使参数获得确定值

Python中的全局变量和局部变量

PS：函数内部是可以修改列表，字典，集合，实例（class），我们通过下面一个图来说明

为什么列表和字典等会被添加和修改呢，原来函数内部知识引用了字典和列表的内存地址，而内存地址无法修改（可以重新开辟一块内存地址），而每个字典和列表中的每一个值都有对应的内存地址，但是记住我们函数是引用的列表或者字典本身的内存地址，所以这样打印到出来的也就会跟着改变了。

全局与局部变量

在子程序中定义的变量称为局部变量，在程序的一开始定义的变量称为全局变量。

全局变量作用域是整个程序，局部变量作用域是定义该变量的子程序。

当全局变量与局部变量同名时：

在定义局部变量的子程序内，局部变量起作用；在其它地方全局变量起作用。

位置参数：

像上面这样实参和形参一一对应的上就是就是位置参数

默认参数：

在函数将一个位置参数设置成一个默认的值的那一个变量就是默认参数，记住默认参数得在位置参数得后面

关键参数：

像上面这样实参和形参不一一对应，并且在调用函数的时候给参数赋值的叫做关键参数

非固定函数：

通过输出结果我们发现*args是接收多余的字符串类型的参数，而想Python="simple"（字典）类型的会传入给**kwargs，这就是非固定参数；当你不知道这个参数需要多少个参数时可以使用该函数类型

递归函数——二分查找

a = [1,2,3,4,5,7,9,10,11,12,14,15,16,17,19,21]
def calc(num,find_num):
 print(num)
 mid = int(len(num) / 2)
 if mid == 0:
  if num[mid] == find_num:
   print("find it %s"%find_num)
  else:
   print("cannt find num")
 if num[mid] == find_num:
  print("find_num %s"%find_num)
 elif num[mid] > find_num:
  calc(num[0:mid],find_num)

 elif num[mid] < find_num:
  calc(num[mid+1:],find_num)
calc(a,12)

Salin selepas log masuk

递归的特性

函数必须有明确的结束（判断）条件，也就是上图一开始的mid[0] 不能等于0，因为这样就会没有意义了

每次进入更深一层递归时，问题规模相比上次递归都应有所减少

递归函数每次向下递归一次，上次的函数占用的内存地址不会被释放，而是一直会被阻塞主，等待函数全部执行完毕后释放，所以也可以说递归是相当消耗内存空间的，对此Python有递归的深度，如果超过该深度函数将会被推出（栈溢出）

匿名函数：

calc = lambda x:x+2 # x是形参，冒号后的内容是该匿名函数执行的动作

print(calc(5))　　　　#匿名函数意识需要通过调用来执行的

calc = lambda x,y,z:x*y*z #匿名函数可以传入多个形参，各个参数之间用逗号隔开
print(calc(2,4,6))
c = map(lambda x:x*2,[2,5,4,6]) #map方法需要 传入两个参数一个是function(函数),itrables（可迭代）的数据类型
for i in c:
 print(i)
#三元运算
for i in map(lambda x:x**2 if x >5 else x - 1,[1,2,3,5,7,8,9]): #lambda最多支持三元运算，map是直接调用匿名函数，但是如果想打印map的内容，需要循环
 print(i)

Salin selepas log masuk

高阶函数：

def calc(x,y,f):
 print(f(x) + f(y))

calc(10,-10,abs)

Salin selepas log masuk

高阶函数的特性

把一个函数的内存地址传给另外一个函数，当做参数

一个函数把另外一个函数的当做返回值返回

满足上面的这个两个特性中的一个就可以称为高阶函数，这里因为偷懒，就是直接调用了Python中的内置函数

Atas ialah kandungan terperinci Python中关于字符编码与函数的使用详解. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Tunjukkan Lagi

Artikel Panas

Assassin's Creed Shadows: Penyelesaian Riddle Seashell

4 minggu yang lalu By DDD

Apa yang Baru di Windows 11 KB5054979 & Cara Memperbaiki Masalah Kemas Kini

3 minggu yang lalu By DDD

Di mana untuk mencari kad kunci kawalan kren di atomfall

4 minggu yang lalu By DDD

<🎜>: Rails Dead - Cara Melengkapkan Setiap Cabaran

1 bulan yang lalu By DDD

Panduan Atomfall: Lokasi Item, Panduan Pencarian, dan Petua

1 bulan yang lalu By DDD

Tunjukkan Lagi

Alat panas

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Tunjukkan Lagi

Topik panas

Di manakah pintu masuk log masuk untuk e-mel gmail?

7696

Tutorial Java

1640

Tutorial CakePHP

1393

Tutorial Laravel

1287

Tutorial PHP

1229

Tunjukkan Lagi

Related knowledge

PHP dan Python: Paradigma yang berbeza dijelaskan Apr 18, 2025 am 12:26 AM

PHP terutamanya pengaturcaraan prosedur, tetapi juga menyokong pengaturcaraan berorientasikan objek (OOP); Python menyokong pelbagai paradigma, termasuk pengaturcaraan OOP, fungsional dan prosedur. PHP sesuai untuk pembangunan web, dan Python sesuai untuk pelbagai aplikasi seperti analisis data dan pembelajaran mesin.

Memilih antara php dan python: panduan Apr 18, 2025 am 12:24 AM

PHP sesuai untuk pembangunan web dan prototaip pesat, dan Python sesuai untuk sains data dan pembelajaran mesin. 1.Php digunakan untuk pembangunan web dinamik, dengan sintaks mudah dan sesuai untuk pembangunan pesat. 2. Python mempunyai sintaks ringkas, sesuai untuk pelbagai bidang, dan mempunyai ekosistem perpustakaan yang kuat.

Python vs JavaScript: Keluk Pembelajaran dan Kemudahan Penggunaan Apr 16, 2025 am 12:12 AM

Python lebih sesuai untuk pemula, dengan lengkung pembelajaran yang lancar dan sintaks ringkas; JavaScript sesuai untuk pembangunan front-end, dengan lengkung pembelajaran yang curam dan sintaks yang fleksibel. 1. Sintaks Python adalah intuitif dan sesuai untuk sains data dan pembangunan back-end. 2. JavaScript adalah fleksibel dan digunakan secara meluas dalam pengaturcaraan depan dan pelayan.

Cara menjalankan program di terminal vscode Apr 15, 2025 pm 06:42 PM

Dalam kod VS, anda boleh menjalankan program di terminal melalui langkah -langkah berikut: Sediakan kod dan buka terminal bersepadu untuk memastikan bahawa direktori kod selaras dengan direktori kerja terminal. Pilih arahan Run mengikut bahasa pengaturcaraan (seperti python python your_file_name.py) untuk memeriksa sama ada ia berjalan dengan jayanya dan menyelesaikan kesilapan. Gunakan debugger untuk meningkatkan kecekapan debug.

Boleh kod vs dijalankan di Windows 8 Apr 15, 2025 pm 07:24 PM

Kod VS boleh dijalankan pada Windows 8, tetapi pengalaman mungkin tidak hebat. Mula -mula pastikan sistem telah dikemas kini ke patch terkini, kemudian muat turun pakej pemasangan kod VS yang sepadan dengan seni bina sistem dan pasangnya seperti yang diminta. Selepas pemasangan, sedar bahawa beberapa sambungan mungkin tidak sesuai dengan Windows 8 dan perlu mencari sambungan alternatif atau menggunakan sistem Windows yang lebih baru dalam mesin maya. Pasang sambungan yang diperlukan untuk memeriksa sama ada ia berfungsi dengan betul. Walaupun kod VS boleh dilaksanakan pada Windows 8, disyorkan untuk menaik taraf ke sistem Windows yang lebih baru untuk pengalaman dan keselamatan pembangunan yang lebih baik.

Bolehkah kod studio visual digunakan dalam python Apr 15, 2025 pm 08:18 PM

Kod VS boleh digunakan untuk menulis Python dan menyediakan banyak ciri yang menjadikannya alat yang ideal untuk membangunkan aplikasi python. Ia membolehkan pengguna untuk: memasang sambungan python untuk mendapatkan fungsi seperti penyempurnaan kod, penonjolan sintaks, dan debugging. Gunakan debugger untuk mengesan kod langkah demi langkah, cari dan selesaikan kesilapan. Mengintegrasikan Git untuk Kawalan Versi. Gunakan alat pemformatan kod untuk mengekalkan konsistensi kod. Gunakan alat linting untuk melihat masalah yang berpotensi lebih awal.

PHP dan Python: menyelam mendalam ke dalam sejarah mereka Apr 18, 2025 am 12:25 AM

PHP berasal pada tahun 1994 dan dibangunkan oleh Rasmuslerdorf. Ia pada asalnya digunakan untuk mengesan pelawat laman web dan secara beransur-ansur berkembang menjadi bahasa skrip sisi pelayan dan digunakan secara meluas dalam pembangunan web. Python telah dibangunkan oleh Guidovan Rossum pada akhir 1980 -an dan pertama kali dikeluarkan pada tahun 1991. Ia menekankan kebolehbacaan dan kesederhanaan kod, dan sesuai untuk pengkomputeran saintifik, analisis data dan bidang lain.

Adakah sambungan vscode berniat jahat? Apr 15, 2025 pm 07:57 PM

Sambungan kod VS menimbulkan risiko yang berniat jahat, seperti menyembunyikan kod jahat, mengeksploitasi kelemahan, dan melancap sebagai sambungan yang sah. Kaedah untuk mengenal pasti sambungan yang berniat jahat termasuk: memeriksa penerbit, membaca komen, memeriksa kod, dan memasang dengan berhati -hati. Langkah -langkah keselamatan juga termasuk: kesedaran keselamatan, tabiat yang baik, kemas kini tetap dan perisian antivirus.

See all articles