社区

学习

工具库

AI工具

休闲

简体中文

首页 > 后端开发 > Python教程 > Python正则表达式匹配HTML页面编码

Python正则表达式匹配HTML页面编码

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

发布： 2016-06-06 11:24:04

原创

1205 人浏览过

html页面一般都会指定一个编码，如何获取到是处理html页面的第一步，因为错误的编码必然带来后面处理的问题。这里我用python的正则表达式写了个：

import re

a = ["<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />",
   '<meta http-equiv=Content-Type content="text/html;charset=gb2312">',
   '<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">',
   '<meta http-equiv="Content-Type" content="text/html; charset=gb2312" />',
   '<meta http-equiv="content-type" content="text/html; charset=utf-8" />',
   '<meta http-equiv="Content-Type" content="text/html; charset=gb2312" />',
   '<meta http-equiv="Content-Type" content="text/html; charset=gb2312" />'
   ]



b = "<meta[ ]+http-equiv=["']&#63;content-type["']&#63;[ ]+content=["']&#63;text/html;[ ]*charset=([0-9-a-zA-Z]+)["']&#63;"


B = re.compile(b, re.IGNORECASE)


for ax in a:
  r1 = B.search(ax)

  if r1:
    print r1.group()
    print r1.group(1), len(r1.group())
  else:
    print 'not match'

登录后复制

相关标签：

python 正则表达式

上一篇：Python使用scrapy采集时伪装成HTTP/1.1的方法下一篇：使用IPython来操作Docker容器的入门指引

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

通过大型语言模型来解释新闻建议

2025-02-25 19:56:14
大语言模型课程

2025-02-25 19:45:15
语义压缩文本以节省LLM成本

2025-02-25 19:29:11
线性关注

2025-02-25 19:10:11
线性化骆驼

2025-02-25 18:38:08
Epic＆＃8220; Crossover＆＃8221;在Alphafold 3和GPT-4O之间，对蛋白质数据库条目的了解

2025-02-25 18:16:09
llms.txt解释了

2025-02-25 17:59:10
教程：用LLM提示的用户消息的语义聚类

2025-02-25 17:12:10
在您的CPU笔记本电脑上建立LLM和神经网络的本地语音助手

2025-02-25 17:10:11
AI特工炒作，解释了＆＃8211;您真正需要知道的才能开始

2025-02-25 17:07:11

最新问题

python - ubuntu16.04 lxml的报错

来自于 1970-01-01 08:00:00

0

0

0

python3.x - java调用python，python代码自动停止了，找不到原因

来自于 1970-01-01 08:00:00

0

0

0

有办法在PHP里写Python吗？

来自于 1970-01-01 08:00:00

0

0

0

python scrapy爬虫错误

来自于 1970-01-01 08:00:00

0

0

0

python相关问题求解决，有偿

来自于 1970-01-01 08:00:00

0

0

0

相关专题

更多>

热门推荐

热门教程

更多>

相关教程

热门推荐

最新课程

最新ThinkPHP 5.1全球首发视频教程(60天成就PHP大牛线上培训班课)

1434431
php入门教程之一周学会PHP

4291191
JAVA 初级入门视频教程

2638740
小甲鱼零基础入门学习Python视频教程

514935
PHP 零基础入门教程

874480

最新下载

更多>

网站特效

网站源码

网站素材

前端模板