python中re模块与正则表达式的介绍(附代码)
本篇文章给大家带来的内容是关于python中re模块与正则表达式的介绍(附代码),有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助。
正则表达式(英语:Regular Expression,在代码中常简写为regex、regexp或RE),又称正规表示式、正规表示法、正规表达式、规则表达式、常规表示法,是计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串。在很多文本编辑器里,正则表达式通常被用来检索、替换那些匹配某个模式的文本。
正则表达式规则,单字符匹配
字符 | 功能 | 正则表达式示例 | 符合匹配示例 |
---|---|---|---|
. | 匹配任意一个字符(除了n) | b.b | bab,b2b |
[ ] | 匹配来自[]中字符集的任意一个字符 | i [abCde]m | i am |
\d | 匹配任何十进制数字,与[0-9]一致 | w\dcschool | w3cschool |
\D | 匹配非数字,即不是数字 | mou\Dh | mouth |
\s | 匹配任何空格字符,与[\n\t\r\v\f]相同 | i\slike | i like |
\S | 匹配任何非空白字符,与\s相反 | n\Se | noe,n3e |
\w | 匹配任何字母数字字符,与[A-Za-z0-9_]相同 | [A-Za-z]w+ | |
\W | 匹配非单词字符 | [0-9]\W[A-Z] | 3 A |
表示数量匹配
字符 | 功能 | 正则表达式示例 | 符合匹配的示例 | |
---|---|---|---|---|
* | 匹配0次或者多次前面出现的正则表达式,即可有可无 | a* | aaa | |
+ | 匹配前一个字符出现1次或者无限次,即至少有一次 | a+ | aaa | |
? | 匹配前一个字符出现1次或者0次,要么有一次,要么没有 | a? | a或者b | |
{m} | 匹配前一个字符出现m次 | [0-9]{5} | 12345 | |
{m.} | 匹配前一个字符至少出现m次 | a{5.} | aaaaa | |
{m,n} | 匹配前一个字符出现从m到n次 | a{2,6} | aaa |
表示边界匹配
字符 | 功能 | 正则表达式示例 |
---|---|---|
^ | 匹配字符串起始部分 | ^Dear |
$ | 匹配字符串终止部分 | fi$ |
b | 匹配任何单词的边界 | \bThe\b |
B | 匹配非单词边界 | .*\Bver\ |
匹配分组
字符 | 功能 | |
---|---|---|
\ | 匹配左右任意一个表达式 | |
(ab) | 将括号中字符作为一个分组 | |
\num | 引用分组num匹配到的字符串 | |
(?P |
分组起别名 | |
(?P=name) | 引用别名为name分组匹配到的字符串 |
re模块
在python中,可以使用内置的re模块来使用正则表达式
re模块常见的函数和方法
核心函数 | 说明 |
---|---|
compile(pattern,flags=0) | 使用任何可选的标记来编译正则表达式的模式,然后返回一个正则表达式对象 |
re模块函数和正则表达式对象方法 | 说明 |
---|---|
match(pattern,string,flags=0) | 尝试使用带有可选的标记的正则表达式的模式来匹配字符串。如果匹配成功,就返回匹配对象; 如果失败,就返回 None |
search(pattern,string,flags=0) | 使用可选标记搜索字符串中第一次出现的正则表达式模式。 如果匹配成功,则返回匹配对象; 如果失败,则返回 None |
findall(pattern,string,[,flags]) | 查找字符串中所有出现的正则表达式,并返回一个列表 |
split(pattern,string,max=0) | 根据正则表达式的模式分隔符,spilt函数将字符串分割为列表,然后返回成功匹配的列表,分割最多操作max次(默认分割所有匹配成功的位置) |
sub(pattern,repl,string,count=0) | 使用repl替换所有正则表达式的模式在字符串中出现的位置,除非定义count,否则就将替换所有出现的位置 |
常用的匹配对象方法 | 说明 |
---|---|
group(num=0) | 默认返回整个匹配对象或者返回编号为num的特定子组 |
groups(default=None) | 返回一个包含所有匹配子组的元组,如果没有成功匹配,返回一个空元组 |
span() |
常用的模块属性,大多数用于对正则表达式函数的修饰 | 说明 |
---|---|
re.I | 使匹配对大小写不敏感(忽略大小写) |
re.S | .(点号)匹配除了n之外的所有字符,re.S标记表示.(点号)能够匹配全部字符 |
re.M | 多行匹配,影响^和$ |
re.U | 根据Unicode字符集解析字符。影响\w,\W,\b和\B |
re.X | 该标志通过给予你更灵活的格式以便你讲正则表达式写得更易于理解 |
re模块一般的使用方法
使用
compile()
函数将正则表达式的字符串形式编译为一个正则表达式对象;通过正则表达式对象提供的一系列方法(如:
match()
)对文本进行匹配查找,获得匹配结果,一个Match
对象;最后使用
Match
对象提供的属性和方法(例如:group()
)获得信息,根据需要进行其他的操作。
re模块使用示例
导入模块
import re
compile()
函数
compile 函数用于编译正则表达式,生成一个 Pattern 对象,它的一般使用形式如下:
import re # 将正则表达式编译成pattern对象 pattern = re.compile(r'\d+')
编译成正则表达式对象后,就可以使用上面所说的正则表达式对象方法了。
match()
方法
match 方法用于查找字符串的头部(也可以指定起始位置),它是一次
匹配,只要找到了一个匹配的结果就返回,而不是查找所有匹配的结果。它的一般使用形式如下:
match(string[, pos[, endpos]])
其中,string是待匹配的字符串,pos 和 endpos 是可选参数,指定字符串的起始
和终点
位置,默认值分别是 0 和 len
(字符串长度)。因此,当你不指定 pos 和 endpos 时,match 方法默认匹配字符串的头部。
当匹配成功时,返回一个 Match 对象,如果没有匹配上,则返回 None。
>>> import re >>> >>> pattern = re.compile(r'\d+') # 正则表达式表示匹配至少一个数字 >>> >>> m = pattern.match("one2three4") # match默认从开头开始匹配,开头是字母o,所以没有匹配成功 >>> print(m) # 匹配失败返回None None >>> >>> m = pattern.match("1two3four") # 开头字符是数字,匹配成功 >>> print(m) <_sre.SRE_Match object; span=(0, 1), match='1'> >>> >>> m.group() # group()方法获取匹配成功的字符 '1' >>> m = pattern.match("onetwo3four56",6,12) # 指定match从数字3开始查找,第一个是数字3,匹配成功 >>> print(m) <_sre.SRE_Match object; span=(6, 7), match='3'> >>> m.group() '3'
以上是python中re模块与正则表达式的介绍(附代码)的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

热门话题

PHP和Python各有优劣,选择取决于项目需求和个人偏好。1.PHP适合快速开发和维护大型Web应用。2.Python在数据科学和机器学习领域占据主导地位。

Python和JavaScript在社区、库和资源方面的对比各有优劣。1)Python社区友好,适合初学者,但前端开发资源不如JavaScript丰富。2)Python在数据科学和机器学习库方面强大,JavaScript则在前端开发库和框架上更胜一筹。3)两者的学习资源都丰富,但Python适合从官方文档开始,JavaScript则以MDNWebDocs为佳。选择应基于项目需求和个人兴趣。

在CentOS系统上启用PyTorchGPU加速,需要安装CUDA、cuDNN以及PyTorch的GPU版本。以下步骤将引导您完成这一过程:CUDA和cuDNN安装确定CUDA版本兼容性:使用nvidia-smi命令查看您的NVIDIA显卡支持的CUDA版本。例如,您的MX450显卡可能支持CUDA11.1或更高版本。下载并安装CUDAToolkit:访问NVIDIACUDAToolkit官网,根据您显卡支持的最高CUDA版本下载并安装相应的版本。安装cuDNN库:前

Docker利用Linux内核特性,提供高效、隔离的应用运行环境。其工作原理如下:1. 镜像作为只读模板,包含运行应用所需的一切;2. 联合文件系统(UnionFS)层叠多个文件系统,只存储差异部分,节省空间并加快速度;3. 守护进程管理镜像和容器,客户端用于交互;4. Namespaces和cgroups实现容器隔离和资源限制;5. 多种网络模式支持容器互联。理解这些核心概念,才能更好地利用Docker。

MinIO对象存储:CentOS系统下的高性能部署MinIO是一款基于Go语言开发的高性能、分布式对象存储系统,与AmazonS3兼容。它支持多种客户端语言,包括Java、Python、JavaScript和Go。本文将简要介绍MinIO在CentOS系统上的安装和兼容性。CentOS版本兼容性MinIO已在多个CentOS版本上得到验证,包括但不限于:CentOS7.9:提供完整的安装指南,涵盖集群配置、环境准备、配置文件设置、磁盘分区以及MinI

在CentOS系统上进行PyTorch分布式训练,需要按照以下步骤操作:PyTorch安装:前提是CentOS系统已安装Python和pip。根据您的CUDA版本,从PyTorch官网获取合适的安装命令。对于仅需CPU的训练,可以使用以下命令:pipinstalltorchtorchvisiontorchaudio如需GPU支持,请确保已安装对应版本的CUDA和cuDNN,并使用相应的PyTorch版本进行安装。分布式环境配置:分布式训练通常需要多台机器或单机多GPU。所

在CentOS系统上安装PyTorch,需要仔细选择合适的版本,并考虑以下几个关键因素:一、系统环境兼容性:操作系统:建议使用CentOS7或更高版本。CUDA与cuDNN:PyTorch版本与CUDA版本密切相关。例如,PyTorch1.9.0需要CUDA11.1,而PyTorch2.0.1则需要CUDA11.3。cuDNN版本也必须与CUDA版本匹配。选择PyTorch版本前,务必确认已安装兼容的CUDA和cuDNN版本。Python版本:PyTorch官方支

在CentOS上更新PyTorch到最新版本,可以按照以下步骤进行:方法一:使用pip升级pip:首先确保你的pip是最新版本,因为旧版本的pip可能无法正确安装最新版本的PyTorch。pipinstall--upgradepip卸载旧版本的PyTorch(如果已安装):pipuninstalltorchtorchvisiontorchaudio安装最新
