Python 中正则表达式详解
正则表达式是用来简洁表达一组字符串的表达式,本文主要和大家分享Python 中正则表达式知识详解,希望能帮助到大家。
操作符 | 说明 | 实例 | |||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
. | 表示任何单个字符 |
|
|||||||||||||||||||||||||||||||||||||||||||||
[ ] | 字符集,单个字符取值范围 |
[abc] 表示a或b或c; [a-z]表示a到z单个字符 |
|||||||||||||||||||||||||||||||||||||||||||||
[^ ] | 非字符集,单个字符排除范围 |
[^abc] 表示非a或非b或非c |
|||||||||||||||||||||||||||||||||||||||||||||
* | 前一个字符的0次或无限次扩展 |
abc* 表示ab、abc、abcc、abccc...
|
|||||||||||||||||||||||||||||||||||||||||||||
前一个字符的1次或无限次扩展 |
abc 表示abc、abcc、abccc...
|
||||||||||||||||||||||||||||||||||||||||||||||
? | 前一个字符的0次或1次扩展 |
abc? 表示ab、abc
|
|||||||||||||||||||||||||||||||||||||||||||||
| | 左右表示任意一个 |
abc|def 表示abc或def
|
|||||||||||||||||||||||||||||||||||||||||||||
{m} | 前一个字符的m次扩展 |
ab{2} 表示abcc
|
|||||||||||||||||||||||||||||||||||||||||||||
{m,n} | 前一个字符的m至n次扩展(含n) |
ab{1,2} 表示abc、abcc
|
|||||||||||||||||||||||||||||||||||||||||||||
^ | 匹配字符串开头 |
^abc 表示abc且在一个字符串的开头 |
|||||||||||||||||||||||||||||||||||||||||||||
$ | 匹配字符串结尾 |
abc$ 表示abc且在一个字符串的结尾 |
|||||||||||||||||||||||||||||||||||||||||||||
( ) | 分组标记,内部只能使用|操作符 |
(abc|def) 表示abc或def
|
|||||||||||||||||||||||||||||||||||||||||||||
d | 数字,等价于[0-9] | ||||||||||||||||||||||||||||||||||||||||||||||
w | 单词字符,等价于[A-Za-z0-9_] |
如果熟悉上面的操作符的话,下面的例子就不难了。
1.只能输入数字:^[0-9]*$
2.只能输入n位的数字:^d{n}$
3.只能输入至少n位的数字:^d{n,}$
4.只能输入m~n位的数字:^d{m,n}$
5.只能输入零和非零开头的数字:^(0|[1-9][0-9]*)$
6.只能输入有两位小数的正实数:^[0-9] (.[0-9]{2})?$
7.只能输入有1~3位小数的正实数:^[0-9] (.[0-9]{1,3})?$
8.只能输入非零的正整数:^ ?[1-9][0-9]*$
函数 | 说明 |
---|---|
re.match() | 从字符串的起始位置匹配一个模式,如果起始位置匹配不成功的话,match()就返回none。 |
re.search() | 扫描整个字符串并返回第一个成功的匹配。 |
re.sub() | 用于替换字符串中的所有匹配正则表达式的子串,返回替换后的字符串 |
re.findall() | 搜索字符串,以列表形式返回全部能匹配的子串 |
re.split() | 将字符串按照正则表达式匹配结果进行切割,返回列表 |
re.finditer() | 搜索字符串,返回一个匹配结果的迭代类型,每个迭代元素是match对象 |
>>> match= re.findall(r'[1-9]\d{5}','100081BIT BIT10008676')>>> print(match) ['100081', '100086']>>> match = re.split(r'[1-9]\d{5}','100081BIT BIT10008676')>>> match ['', 'BIT BIT', '76']>>> match = re.split(r'[1-9]\d{5}','100081BIT BIT10008676',maxsplit=1)>>> match ['', 'BIT BIT10008676'] >>>for m in re.finditer(r'[1-9]\d{5}','100081BIT BIT10008676'): if m: print(m.group(0)) 100081100086
re.match与re.search的区别
re.match只匹配字符串的开始,如果字符串开始不符合正则表达式,则匹配失败,函数返回None;而re.search匹配整个字符串,直到找到一个匹配。
操作符 | 说明 | 实例 |
---|---|---|
. | 表示任何单个字符 | |
[ ] | 字符集,单个字符取值范围 | [abc] 表示a或b或c; [a-z]表示a到z单个字符 |
[^ ] | 非字符集,单个字符排除范围 | [^abc] 表示非a或非b或非c |
* | 前一个字符的0次或无限次扩展 | abc* 表示ab、abc、abcc、abccc... |
前一个字符的1次或无限次扩展 | abc 表示abc、abcc、abccc... | |
? | 前一个字符的0次或1次扩展 | abc? 表示ab、abc |
| | 左右表示任意一个 | abc|def 表示abc或def |
{m} | 前一个字符的m次扩展 | ab{2} 表示abcc |
{m,n} | 前一个字符的m至n次扩展(含n) | ab{1,2} 表示abc、abcc |
^ | 匹配字符串开头 | ^abc 表示abc且在一个字符串的开头 |
$ | 匹配字符串结尾 | abc$ 表示abc且在一个字符串的结尾 |
( ) | 分组标记,内部只能使用|操作符 | (abc|def) 表示abc或def |
d | 数字,等价于[0-9] | |
w | 单词字符,等价于[A-Za-z0-9_] |
如果熟悉上面的操作符的话,下面的例子就不难了。
1.只能输入数字:^[0-9]*$
2.只能输入n位的数字:^d{n}$
3.只能输入至少n位的数字:^d{n,}$
4.只能输入m~n位的数字:^d{m,n}$
5.只能输入零和非零开头的数字:^(0|[1-9][0-9]*)$
6.只能输入有两位小数的正实数:^[0-9] (.[0-9]{2})?$
7.只能输入有1~3位小数的正实数:^[0-9] (.[0-9]{1,3})?$
8.只能输入非零的正整数:^ ?[1-9][0-9]*$
【Python3正则表达式】
函数 | 说明 |
---|---|
re.match() | 从字符串的起始位置匹配一个模式,如果起始位置匹配不成功的话,match()就返回none。 |
re.search() | 扫描整个字符串并返回第一个成功的匹配。 |
re.sub() | 用于替换字符串中的所有匹配正则表达式的子串,返回替换后的字符串 |
re.findall() | 搜索字符串,以列表形式返回全部能匹配的子串 |
re.split() | 将字符串按照正则表达式匹配结果进行切割,返回列表 |
re.finditer() | 搜索字符串,返回一个匹配结果的迭代类型,每个迭代元素是match对象 |
>>> match= re.findall(r'[1-9]\d{5}','100081BIT BIT10008676')>>> print(match) ['100081', '100086']>>> match = re.split(r'[1-9]\d{5}','100081BIT BIT10008676')>>> match ['', 'BIT BIT', '76']>>> match = re.split(r'[1-9]\d{5}','100081BIT BIT10008676',maxsplit=1)>>> match ['', 'BIT BIT10008676'] >>>for m in re.finditer(r'[1-9]\d{5}','100081BIT BIT10008676'): if m: print(m.group(0)) 100081100086
re.match与re.search的区别
re.match只匹配字符串的开始,如果字符串开始不符合正则表达式,则匹配失败,函数返回None;而re.search匹配整个字符串,直到找到一个匹配。
相关推荐:
以上是Python 中正则表达式详解的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

PHP主要是过程式编程,但也支持面向对象编程(OOP);Python支持多种范式,包括OOP、函数式和过程式编程。PHP适合web开发,Python适用于多种应用,如数据分析和机器学习。

PHP适合网页开发和快速原型开发,Python适用于数据科学和机器学习。1.PHP用于动态网页开发,语法简单,适合快速开发。2.Python语法简洁,适用于多领域,库生态系统强大。

PHP起源于1994年,由RasmusLerdorf开发,最初用于跟踪网站访问者,逐渐演变为服务器端脚本语言,广泛应用于网页开发。Python由GuidovanRossum于1980年代末开发,1991年首次发布,强调代码可读性和简洁性,适用于科学计算、数据分析等领域。

Golang在性能和可扩展性方面优于Python。1)Golang的编译型特性和高效并发模型使其在高并发场景下表现出色。2)Python作为解释型语言,执行速度较慢,但通过工具如Cython可优化性能。

Golang和Python各有优势:Golang适合高性能和并发编程,Python适用于数据科学和Web开发。 Golang以其并发模型和高效性能着称,Python则以简洁语法和丰富库生态系统着称。

Python更易学且易用,C 则更强大但复杂。1.Python语法简洁,适合初学者,动态类型和自动内存管理使其易用,但可能导致运行时错误。2.C 提供低级控制和高级特性,适合高性能应用,但学习门槛高,需手动管理内存和类型安全。

Python在开发效率上优于C ,但C 在执行性能上更高。1.Python的简洁语法和丰富库提高开发效率。2.C 的编译型特性和硬件控制提升执行性能。选择时需根据项目需求权衡开发速度与执行效率。

Python和JavaScript在开发环境上的选择都很重要。1)Python的开发环境包括PyCharm、JupyterNotebook和Anaconda,适合数据科学和快速原型开发。2)JavaScript的开发环境包括Node.js、VSCode和Webpack,适用于前端和后端开发。根据项目需求选择合适的工具可以提高开发效率和项目成功率。
