正则表达式字符小结
正则表达式基本
匹配单个字符
匹配单个数字的写法,可以是 “[0-9]
” 也可以是 “\d
”。
匹配单个非数字字符,则使用大写 “\D
”。
匹配 26 个字母的任意一个,使用 “[a-zA-Z]
”
匹配任意一个字符,使用点号 “.
”
匹配具体字符,则直接写上去即可。比如 “abcd
” 就是匹配它本身。如果遇到特殊字符,则需要进行转义,转义字符为 “\</code>”。
匹配一个字符,使用中括号的做法称为 “字符集”。中括号用于指定一个 “集”,匹配这个集中的一个字符,如十六进制数 “[0-9a-fA-F]
”。字符集内的点表示的是点号本身,但其他的特殊字符还是需要进行转移,比如反斜杠字符。
使用量词
贪心匹配
如果要表示某个规则的重复,则需要使用量词。使用花括号表示重复次数。比如 8 个数字可以这样表示:“\d{8}
”
花括号中的量词可以变化,比如表示 7 到 8 个数字,则表示为 “\d{7,8}
”。表示上限的右值可以不写,比如 “{0,}
” 是合法的,表示大于等于 0 个字符;但试图单独表示上限的 “{,10}
” 则不合法,至少应该写为 “{0,10}
”。
加号 “+
” 表示它左边的元素数量为 “一个或多个”,等于 “{1,}
” 的效果。所以加号也是特殊字符。
星号 “*
” 表示它左边的元素数量为 “零个或至少一个”,即 “{0,}
”。
问号 “?
” 表示 “零个或一个”,等同于 “{0,1}
”。
懒惰匹配
上面的诸如 +
、*
,匹配的时候都会使用 “贪心” 的模式,也就是匹配尽量多的个数。比如字符串 “55555”,使用 “5+
” 去匹配时,会匹配到它能够找到的最长字符串,即 “55555”。
如果在量词后面加上问号,则使匹配模式变为 “懒惰” 的,也就是匹配最少的。比如使用 “5+?
” 去匹配,则只会找到能够匹配的最小字符 “5”.
以下都是可用的懒惰匹配表达式:+?
, *?
, {n,}?
, {m,n}?
捕获分组(类似于宏定义)
可以把表达式中的一部分 “捕获” 起来,作为宏放在后边引用。使用括号进行定义(捕获),然后再定义的后面使用 “\1
” 进行引用;如果是第二个捕获,则使用 “\2
”,以此类推。
分组一般都会被保存起来,但是当表达式非常长的时候,可能需要明确指明不保存该分组。比如使用这个格式 “(?:THE|The|the)
”,就使用了 “?:
” 标号来表示不要进行命名标记。
“或” 逻辑
使用 “|
” 来链接两个字段,提供 “或” 的逻辑。注意与括号搭配使用
“非” 逻辑
如果在集合 “[...]
” 中使用字符 “^
”,则表示 “非”,如 “[^0-9]
” 等同于 “\D
”。
简单的模式匹配
以下是各种常用的单字符匹配列表:
指代类型 | 模式 | 备注 |
---|---|---|
数字 | \d |
|
字母、数字、下划线 | \w |
等效于 “[_a-zA-Z0-9] ” |
非数字 | \D |
|
非字母 | \W |
|
制表符 Tab | \t |
|
Null 字符 | \0 |
|
Backspace | [\b] |
|
空格 | \s |
等效于 “[ \t\n\r] ” |
Return | \r |
|
换行 | \n |
|
单词之间的空白 | \b |
这里只是匹配单词的开始 / 结束,不消耗任何字符 |
任意一个字符 | . |
行结束符无法使用这个符号匹配 |
边界
本小节设计一个概念:断言,又称为 “零宽度断言(zero-width asseration)”。这个概念不匹配字符,而是匹配字符串中的位置。
行的起始和结束
使用 “
^
” 表示一行的开始使用 “
$
” 表示一行的终止
单词边界和非单词边界
比如要匹配单词 “the”,则写 “\bthe\b
”。如果要匹配哥哥中间带 “e” 的单词,则可以写 “\Be\B
”
可以使用 “\<
” 匹配单词开头,“\>
” 匹配单词结尾。但是这两个并不建议使用,因为新的匹配器可能不支持。
Unicode 字符和其他字符
正则表达式支持输入 unicode 的值,如 “\u00e9
”。注意 unicode 必须有四位十六进制位,大小写均可。Javascript 还支持 “\xe9
” 的写法,然而 “\x00e9
” 则是错误的。
相关推荐:
以上是正则表达式字符小结的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

热门话题

使用Java的Character.isDigit()函数判断字符是否为数字字符在计算机内部以ASCII码的形式表示,每个字符都有一个对应的ASCII码。其中,数字字符0到9分别对应的ASCII码值为48到57。要判断一个字符是否为数字,可以使用Java中的Character类提供的isDigit()方法进行判断。isDigit()方法是Character类的

如何使用自动更正在 Word 中键入箭头在 Word 中键入箭头的最快方法之一是使用预定义的自动更正快捷方式。如果您键入特定的字符序列,Word 会自动将这些字符转换为箭头符号。您可以使用此方法绘制多种不同的箭头样式。要使用自动更正在 Word 中键入箭头:将光标移动到文档中要显示箭头的位置。键入以下字符组合之一:如果您不希望将您键入的内容更正为箭头符号,请按键盘上的退格键会将

上标是一个字符或多个字符,可以是字母或数字,您需要将其设置为略高于正常文本行。例如,如果您需要写1st,则字母st需要略高于字符1。同样,下标是一组字符或单个字符,需要设置为略低于正常文本级别。例如,当你写化学式时,你需要把数字放在正常字符行的下方。以下屏幕截图显示了上标和下标格式的一些示例。尽管这似乎是一项艰巨的任务,但实际上将上标和下标格式应用于您的文本非常简单。在本文中,我们将通过一些简单的步骤说明如何轻松地使用上标或下标格式设置文本。希望你喜欢阅读这篇文章。如何在 Excel 中应用上标

您的物理或数字键盘在表面上提供有限数量的字符选项。但是,有几种方法可以在iPhone、iPad和Mac上访问重音字母、特殊字符等。标准iOS键盘可让您快速访问大写和小写字母、标准数字、标点符号和字符。当然,还有很多其他角色。您可以从带有变音符号的字母到倒置的问号中进行选择。您可能无意中发现了隐藏的特殊字符。如果没有,以下是在iPhone、iPad和Mac上访问它们的方法。如何在iPhone和iPad上访问扩展字符在iPhone或iPad上获取扩展字符非常简单。在“信息”、“

在matplotlib中正确地显示中文字符,是很多中文用户常常遇到的问题。默认情况下,matplotlib使用的是英文字体,无法正确显示中文字符。为了解决这个问题,我们需要设置正确的中文字体,并将其应用到matplotlib中。下面是一些具体的代码示例,帮助你正确地在matplotlib中显示中文字符。首先,我们需要导入需要的库:importmatplot

如何使用Golang判断一个字符是否为字母在Golang中,判断一个字符是否为字母可以通过使用Unicode包中的IsLetter函数来实现。IsLetter函数会检查给定的字符是否是一个字母。接下来,我们将详细介绍如何使用Golang编写代码来判断一个字符是否为字母。首先,你需要创建一个新的Go文件,用于编写代码。你可以将文件命名为"main.go"。代码

Java中回车键的字符表示是`。在Java中,`表示换行符,当遇到这个字符时,文本输出会换行。下面是一个简单的代码示例,演示如何使用``来表示回车键:publicclassMain{publicstaticvoidmain(String[]args){System.out.println("这是第一行这

在平板电脑模式下启用触控键盘如果您有触摸屏笔记本电脑,则可以使用触摸键盘在Windows11上键入多个特殊字符。这可能是添加特殊字符的最简单方法。在Windows11上启用特殊字符的触摸屏:打开开始菜单并选择设置。当设置打开时,导航到时间和语言>打字>触摸键盘。在“键入”菜单中,选中“没有键盘时显示触摸键盘”选项。启用无平板电脑模式的触控键盘访问触摸键盘的另一种方法是使其全时显示在任务栏上。要使触摸键盘可访问,您需要告诉Windows11显示它。使用以下步骤:在开始菜单中,选
