python字符编码文件方法介绍
字符编码发展
ASCII 255 只支持英文字母和数字,特殊字符 1bytes
Unicode 中文和英文 统一2bytes
utf-8 中文>3bytes 英文>1bytes
bytes类型
文本数据总是unicode由str类型表示,二进制数据则由bytes类型表示
二进制数据用在视频,音频文件以及发送socket网络传输数据等
字符串转成二进制 str.encode("encoding=utf-8")
二进制转成字符串 b'\xe2\x82'.decode("encoding=utf-8")
文件句柄 就是 文件对象的内存地址
字符编码和转码
ASCII码表中不能存中文,windows默认的系统字符编码是GBK.
Unicode 字符编码能存储世界上所有的字符,但所有字符都占用了两个字节,原来一个2M
的英文文件使用Unicode后需要占用4M的存储空间
utf-8字符串转换成gbk字符
任何两种编码的字符串进行转换都必须通过先转成Unicode编码来实现
Unicode(统一码、万国码、单一码)是一种在计算机上使用的字符编码。Unicode 是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码.
乱码的出现基本上就两种情况:
1、字符编码没有
2、字符编码冲突了,人家在写这个程序的时候指定的字符集和咱们使用的字符集的位置不对
在2.x版本的Python中Pyton在解释.py文件的时候,默认是给他一个编码的就是ASCII码
Python3中默认就是Unicode编码
因为在python2.X中默认是ASCII编码,你在文件中指定编码为UTF-8,但是UTF-8如果你想转GBK的话是不能直接转的,的需要Unicode做一个转接站点。
str ="你好" //这个字符串采用utf-8编码
new_str=str.decode('utf-8') //把str原来的编码格式传递到decode函数转码成Unicode编码
ret = new_str.encode('GBK') //把unicode编码转换成GBK编码字符串
str= u"你好" 在字符串前面加个u字母表示此字符串设置成Unicode编码
编码
python解释器在加载 .py 文件中的代码时,会对内容进行编码(默认ascill)所以如果不指定编码类型,
如果有中文就会报错。
Python的工作过程
python 把代码读到内存 2、词法语法分析 3、放到编译器 ---》 生成字节码 4、执行字节码 ---》生成机器码 CPU执行
变量
字符串的值是不能被修改的,他在内存里是连续的,如果想改的话必须在后面预留所以不支持修改!
字符串特性,一旦修改,重新创建
以上是python字符编码文件方法介绍的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

在LAMP架构下整合Node.js或Python服务许多网站开发者都面临这样的问题:已有的LAMP(Linux Apache MySQL PHP)架构网站需要...

使用Scapy爬虫时,管道持久化存储文件无法写入的原因探讨在学习使用Scapy爬虫进行数据抓取时,经常会遇到一�...

Python进程池处理并发TCP请求导致客户端卡死的解析在使用Python进行网络编程时,高效处理并发TCP请求至关重要。...

深入探讨Pythonfunctools.partial对象的查看方法在使用Python的functools.partial...

Python跨平台桌面应用开发库的选择许多Python开发者都希望开发出能够在Windows和Linux系统上都能运行的桌面应用程...

Python入门:沙漏图形绘制及输入校验本文将解决一个Python新手在沙漏图形绘制程序中遇到的变量定义问题。代码...

在Python中如何处理高分辨率图片以查找白色区域?处理一张9000x7000像素的高分辨率图片,如何准确找出图片中两...

数据转换与统计:高效处理大型数据集本文将详细介绍如何将一个包含商品信息的数据列表,转换为另一个包含...
