社区

学习

工具库

AI工具

休闲

简体中文

首页 > 后端开发 > Python教程 > python处理中文编码和判断编码示例

python处理中文编码和判断编码示例

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

发布： 2016-06-16 08:45:04

原创

1165 人浏览过

下面所说的都是针对python2.7

复制代码代码如下:

#coding:utf-8
#chardet 需要下载安装

import chardet
#抓取网页html
line = "http://www.***.com"
html_1 = urllib2.urlopen(line,timeout=120).read()
#print html_1
encoding_dict = chardet.detect(html_1)
#print encoding
web_encoding = encoding_dict['encoding']
if web_encoding == 'utf-8' or web_encoding == 'UTF-8':

html = html_1
else :
html = html_1.decode('gbk','ignore').encode('utf-8')

#有以上处理，整个html就不会是乱码。

相关标签：

中文编码

上一篇：python实现博客文章爬虫示例下一篇：简单的通用表达式求10乘阶示例

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

LLM的工作方式：培训前训练，神经网络，幻觉和推理

2025-02-26 03:58:14
我将区块链和AI组合在一起以生成艺术。接下来发生了什么。

2025-02-26 03:38:10
高级及时工程：思想链（COT）

2025-02-26 03:17:10
在Sqlite中检索增强发电

2025-02-26 02:49:09
如何使用LLM驱动的样板构建自己的节点。JSAPI

2025-02-26 01:08:13
2024年编码的LLM：价格，性能和争取最佳的战斗

2025-02-26 00:46:10
提示视觉语言模型

2025-02-25 23:42:08
如何衡量大语模型的响应的可靠性

2025-02-25 22:50:13
生活的幻想

2025-02-25 21:54:11
科学家对大型语言模型的认真反映了人类思维

2025-02-25 20:45:11

最新问题

哪些流行的Python库及其用途？

2025-03-21 18:46:29
python中的腌制和挑剔是什么？

2025-03-21 18:45:34
您最喜欢学习和开发的Python资源是什么？

2025-03-21 13:19:29
您如何使用Python的环境变量？

2025-03-21 13:16:30
Python中GC模块的目的是什么？

2025-03-21 13:13:27

相关专题

更多>

热门推荐

热门教程

更多>

相关教程

热门推荐

最新课程

最新ThinkPHP 5.1全球首发视频教程(60天成就PHP大牛线上培训班课)

1438764
php入门教程之一周学会PHP

4299771
JAVA 初级入门视频教程

2677553
小甲鱼零基础入门学习Python视频教程

517713
PHP 零基础入门教程

878950

最新下载

更多>

网站特效

网站源码

网站素材

前端模板