目录
PHP正则中的捕获组与非捕获组,php捕获组
首页 php教程 php手册 PHP正则中的捕获组与非捕获组,php捕获组

PHP正则中的捕获组与非捕获组,php捕获组

Jun 13, 2016 am 08:51 AM
正则表达式

PHP正则中的捕获组与非捕获组,php捕获组

今天遇到一个正则匹配的问题,忽然翻到有捕获组的概念,手册上也是一略而过,百度时无意翻到C#和Java中有对正则捕获组的特殊用法,搜索关键词有PHP时竟然没有相关内容,自己试了一下,发现在PHP中也是可行的,于是总结一下,分享的同时也希望有大神和细心的学习者找到我理解中出现的问题。


 

什么是捕获组

我们先看一下PHP的正则匹配函数

<p>int preg_match ( string $pattern , string $subject [, array &$matches [, int $flags = 0 [, int $offset = 0 ]]] )</p>
登录后复制

前面两项是我们常用的,$pattern是正则匹配模式,$string是要匹配的字符串。

array &$match,它是一个数组,&表示匹配出来的结果会被写入$match中。

int $flags 如果传递了这个标记, 对于每一个出现的匹配返回时会附加字符串偏移量(相对于目标字符串的)。

int $offset 用于指定从目标字符串的某个未知开始搜索(单位是字节)。

我们主要看一下$match的值里会有什么:

<span>$mode</span> = '/a=(\d+)b=(\d+)c=(\d+)/'<span>;

</span><span>$str</span>='**a=4b=98c=56**'<span>;

</span><span>$res</span>=<span>preg_match</span>(<span>$mode</span>,<span>$str</span>,<span>$match</span><span>);

</span><span>var_dump</span>(<span>$match</span>);
登录后复制

结果如下:

<span>array</span> (size=4<span>)

  </span>0 => <span>string</span> 'a=4b=98c=56' (length=11<span>)

  </span>1 => <span>string</span> '4' (length=1<span>)

  </span>2 => <span>string</span> '98' (length=2<span>)

  </span>3 => <span>string</span> '56' (length=2)
登录后复制

现在我们知道了什么是捕获组,捕获组是正则表达示中以()括起来的部分,每一对()是一个捕获组。

PHP会为它编号,从1开始。至于为什么会从1开始,那是因为PHP把匹配到的完整字符串编号为0。

如果有多个括号或嵌套括号,按左边括号出现的顺序来进行编号,如图:

按图中的匹配模式匹配时,捕获组的123号分别是红绿蓝。


捕获组的忽略与命名

我们还可以阻止PHP为匹配组的编号:在匹配组中模式前加 ?:

$mode = '/a=(\d+)b=(?:\d+)c=(\d+)/';

这样,匹配结果就会变成:

<span>array</span> (size=3<span>)

  </span>0 => <span>string</span> 'a=4b=98c=56' (length=11<span>)

  </span>1 => <span>string</span> '4' (length=1<span>)

  </span>2 => <span>string</span> '56' (length=2)
登录后复制

当然,我们也可以在括号的内部为它给它独特的名字。

<p>命名子组可以接受(?<name>), (?'name') 以及(?P<name>)语法. 之前版本仅接受(?P<name>)语法.</p>
登录后复制

例如:$mode = '/a=(\d+)b=(?P\d+)c=(\d+)/';

使用时结果为:

<span>array</span> (size=5<span>)

  </span>0 => <span>string</span> 'a=4b=98c=56' (length=11<span>)

  </span>1 => <span>string</span> '4' (length=1<span>)

  </span>'sec' => <span>string</span> '98' (length=2<span>)

  </span>2 => <span>string</span> '98' (length=2<span>)

  </span>3 => <span>string</span> '56' (length=2)
登录后复制

在保留索引数组的同时,加上一个关联项,key值为捕获组名。


捕获组的反向引用

我们在用preg_replace()函数进行正则替换时,我们还可以使用 \n $n 来引用第n个捕获组.

<span>$mode</span> = '/a=(\d+)b=(\d+)c=(\d+)/'<span>;

</span><span>$str</span>='**a=4b=98c=56**'<span>;

</span><span>$rp</span>='\1/$2/\3/'<span>;

</span><span>echo</span> <span>preg_replace</span>(<span>$mode</span>,<span>$rp</span>,<span>$str</span>);<span>//</span><span>**4/98/56/**</span>
登录后复制

\1表示捕获组1(4),$2为捕获组2(98),\3为捕获组3(56)。

非捕获组的用法:

为什么称为非捕获组呢?那是因为它们有捕获组的特性,在匹配模式的()中,但是匹配时,PHP不会为它们编组,它们只会影响匹配结果,并不作为结果输出。


/d(?=xxx) 匹配"后面是xxx的一个数字"。

注意格式:只能放在匹配模式字符串之后

例如:

<span>$pattern</span>='/\d(?=abc)/'<span>;

</span><span>$str</span>="ab36abc8eg"<span>;

</span><span>$res</span>=<span>preg_match</span>(<span>$pattern</span>,<span>$str</span>,<span>$match</span><span>);

</span><span>var_dump</span>(<span>$match</span>);<span>//</span><span>6</span>
登录后复制

匹配的6,因为只有它作为一个数字,后面还有abc。


(?<=xxx) /d 匹配"前面是xxx的一个数字"

注意格式:只能放在匹配模式字符串之前

例如:

<span>$pattern</span>='/(?<=abc)\d/'<span>;

</span><span>$str</span>="ab36abc8eg"<span>;

</span><span>$res</span>=<span>preg_match</span>(<span>$pattern</span>,<span>$str</span>,<span>$match</span><span>);

</span><span>var_dump</span>(<span>$match</span>);<span>//8</span><span><br /></span>
登录后复制

匹配的8,因为只有它作为一个数字,后面还有abc。


 

与(?=xxx)  (?!

 

它表示前面/后面不是xxx的字符串,这里就不再举例了。

如果您觉得本博文对您有帮助,您可以推荐或关注我,如果您有什么问题,可以在下方留言讨论,谢谢。

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么(黄色晶体)
2 周前 By 尊渡假赌尊渡假赌尊渡假赌
仓库:如何复兴队友
4 周前 By 尊渡假赌尊渡假赌尊渡假赌
Hello Kitty Island冒险:如何获得巨型种子
4 周前 By 尊渡假赌尊渡假赌尊渡假赌

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

PHP正则表达式验证:数字格式检测 PHP正则表达式验证:数字格式检测 Mar 21, 2024 am 09:45 AM

PHP正则表达式验证:数字格式检测在编写PHP程序时,经常需要对用户输入的数据进行验证,其中一个常见的验证是检查数据是否符合指定的数字格式。在PHP中,可以使用正则表达式来实现这种验证。本文将介绍如何使用PHP正则表达式来验证数字格式,并提供具体的代码示例。首先,让我们看一下常见的数字格式验证要求:整数:只包含数字0-9,可以以正负号开头,不包含小数点。浮点

PHP正则表达式:精确匹配与排除模糊包含 PHP正则表达式:精确匹配与排除模糊包含 Feb 28, 2024 pm 01:03 PM

PHP正则表达式:精确匹配与排除模糊包含正则表达式是一种强大的文本匹配工具,能够帮助程序员在处理文本时进行高效的搜索、替换和筛选。在PHP中,正则表达式也被广泛应用于字符串处理和数据匹配中。本文将重点介绍在PHP中如何进行精确匹配和排除模糊包含的操作,同时结合具体的代码示例进行说明。精确匹配精确匹配意味着只匹配符合完全条件的字符串,不匹配任何变种或包含额外字

如何使用正则表达式在 Golang 中验证电子邮件地址? 如何使用正则表达式在 Golang 中验证电子邮件地址? May 31, 2024 pm 01:04 PM

要使用正则表达式在Golang中验证电子邮件地址,请执行以下步骤:使用regexp.MustCompile创建一个正则表达式模式,匹配有效的电子邮件地址格式。使用MatchString函数检查字符串是否与模式匹配。该模式涵盖了大多数有效的电子邮件地址格式,包括:局部用户名可以包含字母、数字和特殊字符:!.#$%&'*+/=?^_{|}~-`域名至少包含一个字母,后面可以跟字母、数字或连字符顶级域名(TLD)不能超过63个字符长

掌握Go语言的正则表达式和字符串处理 掌握Go语言的正则表达式和字符串处理 Nov 30, 2023 am 09:54 AM

Go语言作为一门现代化的编程语言,提供了强大的正则表达式和字符串处理功能,使得开发者能够更高效地处理字符串数据。掌握Go语言的正则表达式和字符串处理,对于开发者来说是非常重要的。本文将详细介绍Go语言中正则表达式的基本概念和用法,以及如何使用Go语言处理字符串。一、正则表达式正则表达式是一种用于描述字符串模式的工具,能够方便地实现字符串的匹配、查找和替换等操

如何在 Go 中使用正则表达式匹配时间戳? 如何在 Go 中使用正则表达式匹配时间戳? Jun 02, 2024 am 09:00 AM

在Go中,可以使用正则表达式匹配时间戳:编译正则表达式字符串,例如用于匹配ISO8601时间戳的表达式:^\d{4}-\d{2}-\d{2}T\d{2}:\d{2}:\d{2}(\.\d+)?(Z|[+-][0-9]{2}:[0-9]{2})$。使用regexp.MatchString函数检查字符串是否与正则表达式匹配。

如何在 Go 中使用正则表达式验证密码? 如何在 Go 中使用正则表达式验证密码? Jun 02, 2024 pm 07:31 PM

Go中使用正则表达式验证密码的方法如下:定义正则表达式模式,符合最低密码要求:至少8个字符,包含小写字母、大写字母、数字和特殊字符。使用regexp包中的MustCompile函数编译正则表达式模式。使用MatchString方法测试输入字符串是否与正则表达式模式匹配。

如何在 Golang 中用正则表达式检测 URL? 如何在 Golang 中用正则表达式检测 URL? May 31, 2024 am 10:32 AM

使用正则表达式在Golang中检测URL的步骤如下:使用regexp.MustCompile(pattern)编译正则表达式模式。模式需匹配协议、主机名、端口(可选)、路径(可选)和查询参数(可选)。使用regexp.MatchString(pattern,url)检测URL是否匹配模式。

正则表达式通配符有哪些 正则表达式通配符有哪些 Nov 17, 2023 pm 01:40 PM

正则表达式通配符有"."、"*"、"+"、"?"、"^"、"$"、"[]"、"[^]"、"[a-z]"、"[A-Z]"、"[0-9]"、"\d"、"\D"、"\w"、"\W"、"\s&quo

See all articles