PHP之正则表达式捕获组与非捕获组（详解）

집

백엔드 개발

PHP 튜토리얼

PHP之正则表达式捕获组与非捕获组（详解）_PHP

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

May 30, 2016 am 08:47 AM

정규식

在项目开发过程中正则表示经常会用到，可以说会正则表达式是每个程序员最基本的要求，初学者在刚接触正则表达式都感到很吃力。最近看到一位朋友的博客写的《PHP正则表达式》获益颇多，在章节对通配符以及捕获数据非常感兴趣。这两章节刚好也涉及到了正则表达式的捕获组和非捕获组的内容，以此来分析这方面的内容

　　我们知道，在正则表达式下(x) 表示匹配'x'并记录匹配的值。这只是比较通俗的说法，甚至说这是不严谨的说法，只有（）捕获组形式才会记录匹配的值。非捕获组则只匹配，不记录。

　　捕获组：

　　(pattern)

这种形式是我们见到最多的一种形式，匹配并返回捕获结果，可以嵌套，组号顺序从左到右依次排列‘。

代码如下:

$regex = '/(ab(c)+)+d(e)?/';
$str = 'abccde';
$matches = array();

if(preg_match($regex, $str, $matches)){
print_r($matches);
}

　　匹配结果：

代码如下:

Array ( [0] => abccde [1] => abcc [2] => c [3] => e )
　　(?Ppattern)

这种方式虽然看起来在构造正则表达式的时候略微复杂一点，但实质上与(pattern)一样。最大的优势体现在对结果处理上，程序员可以直接根据自己设置的直接快速调用结果，而不用再去数需要的结果在第几个子组了。

代码如下:

$regex = '/(?P\w(?P\w))abc(?P\w)45/';

$str = 'fsabcd45';
$matches = array();

if(preg_match($regex, $str, $matches)){
print_r($matches);
}

　　匹配结果：

代码如下:

Array ( [0] => fsabcd45 [group1] => fs [1] => fs [group2] => s [2] => s [group3] => d [3] => d )
　　\num

num是一个整数，是对捕获组的反向引用。例如\2表示第二个子组匹配值，\表示第一个子组匹配值

代码如下:

$regex = '/(\w)(\w)\2\1/';
$str = 'abba';
$matches = array();

if(preg_match($regex, $str, $matches)){
print_r($matches);
}

　　匹配结果：

代码如下:

Array ( [0] => abba [1] => a [2] => b )

注意，这里我疏忽了一个小细节，一开始我第一样代码是 $regex = “/(\w)(\w)\2\1/”; 结果返回无匹配结果，经过调试后，发现这里只能用' '。'与" 用法差别大家还是需要注意下。

　　了解了(?Ppattern)与\num，这个就不难理解了。\k是对命名捕获组的反向引用。其中 name 是捕获组名。

代码如下:

$regex='/(?P\w)abc\k/';

$str="fabcf";

echo preg_match_all($regex, $str,$matches);

print_r($matches);

　　匹配结果：

代码如下:

Array ( [0] => Array ( [0] => fabcf ) [name] => Array ( [0] => f ) [1] => Array ( [0] => f ) )

　　非捕获组：

　　(?:pattern)

　　与(pattern)的唯一区别是，匹配pattern但不捕获匹配结果。这里便不再举例。

　　还有四种方式实际上讲的是一个事情：预查。

　　预查分为正向预查与反向预查。根据字面理解，正向预查是判断匹配字符串后面某些字符存在与否，而反向预查则是判断匹配字符串前面某些字符存在与否。

　　正向预查判断存在使用(?=pattern)，判断不存在使用(?!pattern)。

　　反向预查判断存在使用(?

代码如下:

$regx='/(?
$str="abcd ebcd abce ebca";

if(preg_match_all($regx, $str, $matches)){

print_r($matches);
}

　　匹配结果：

代码如下:

Array ( [0] => Array ( [0] => bc) )

　　这四种形式使用的是否只要注意好相对匹配字符串的位置和断言肯定还是否定，就会很快掌握。

　　另外，预查的四种形式是零宽度的，匹配的时候只做一个判断，本身是不占位置的。/HE(?=L)LLO/ 与HELLO匹配，而/HE(?=L)LO/与HELLO是不匹配的。毕竟但从字节数上两者就是不匹配的，前者只有4个，而后者有5个。

以上就是PHP之正则表达式捕获组与非捕获组详解的全部内容，希望对大家有所启迪。

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

뜨거운 도구

뜨거운 주제

Gmail 이메일의 로그인 입구는 어디에 있나요?

7569

Cakephp 튜토리얼

1386

Steam의 계정 이름 형식은 무엇입니까?

Win11 활성화 키 영구

NYT 연결 힌트와 답변

108

Related knowledge

PHP 정규식 유효성 검사: 숫자 형식 감지 Mar 21, 2024 am 09:45 AM

PHP 정규식 확인: 숫자 형식 감지 PHP 프로그램을 작성할 때 사용자가 입력한 데이터를 확인해야 하는 경우가 종종 있습니다. 일반적인 확인 중 하나는 데이터가 지정된 숫자 형식을 준수하는지 확인하는 것입니다. PHP에서는 정규식을 사용하여 이러한 종류의 유효성 검사를 수행할 수 있습니다. 이 기사에서는 PHP 정규식을 사용하여 숫자 형식을 확인하고 구체적인 코드 예제를 제공하는 방법을 소개합니다. 먼저 일반적인 숫자 형식 유효성 검사 요구 사항을 살펴보겠습니다. 정수: 0~9의 숫자만 포함하고 더하기 또는 빼기 기호로 시작할 수 있으며 소수점을 포함하지 않습니다. 부동 소수점

정규식을 사용하여 Golang에서 이메일 주소를 확인하는 방법은 무엇입니까? May 31, 2024 pm 01:04 PM

정규식을 사용하여 Golang에서 이메일 주소를 확인하려면 다음 단계를 따르세요. regexp.MustCompile을 사용하여 유효한 이메일 주소 형식과 일치하는 정규식 패턴을 만듭니다. MatchString 함수를 사용하여 문자열이 패턴과 일치하는지 확인합니다. 이 패턴은 다음을 포함하여 대부분의 유효한 이메일 주소 형식을 다룹니다. 로컬 사용자 이름에는 문자, 숫자 및 특수 문자가 포함될 수 있습니다: !.#$%&'*+/=?^_{|}~-`도메인 이름에는 최소한 다음이 포함되어야 합니다. 문자 1개 뒤에 문자, 숫자 또는 하이픈이 옵니다. 최상위 도메인(TLD)의 길이는 63자를 초과할 수 없습니다.

Go에서 정규식을 사용하여 타임스탬프를 일치시키는 방법은 무엇입니까? Jun 02, 2024 am 09:00 AM

Go에서는 정규식을 사용하여 타임스탬프를 일치시킬 수 있습니다. ISO8601 타임스탬프를 일치시키는 데 사용되는 것과 같은 정규식 문자열을 컴파일합니다. ^\d{4}-\d{2}-\d{2}T \d{ 2}:\d{2}:\d{2}(\.\d+)?(Z|[+-][0-9]{2}:[0-9]{2})$ . regexp.MatchString 함수를 사용하여 문자열이 정규식과 일치하는지 확인합니다.

Go 언어의 정규식 및 문자열 처리를 마스터하세요. Nov 30, 2023 am 09:54 AM

최신 프로그래밍 언어인 Go 언어는 강력한 정규식과 문자열 처리 기능을 제공하여 개발자가 문자열 데이터를 보다 효율적으로 처리할 수 있도록 해줍니다. 개발자가 Go 언어에서 정규식과 문자열 처리를 익히는 것은 매우 중요합니다. 본 글에서는 Go 언어에서 정규 표현식의 기본 개념과 사용법, Go 언어를 사용하여 문자열을 처리하는 방법을 자세히 소개합니다. 1. 정규식 정규식은 문자열 패턴을 설명하는 데 사용되는 도구로 문자열 일치, 검색, 바꾸기 등의 작업을 쉽게 구현할 수 있습니다.

PHP 정규식: 퍼지 포함의 정확한 일치 및 제외 Feb 28, 2024 pm 01:03 PM

PHP 정규식: 정확한 일치 및 제외 퍼지 포함 정규식은 프로그래머가 텍스트를 처리할 때 효율적인 검색, 바꾸기 및 필터링을 수행하는 데 도움이 되는 강력한 텍스트 일치 도구입니다. PHP에서는 정규식도 문자열 처리 및 데이터 일치에 널리 사용됩니다. 이 기사에서는 PHP에서 정확한 일치를 수행하고 퍼지 포함 작업을 제외하는 방법에 중점을 두고 구체적인 코드 예제를 통해 설명합니다. 완전 일치 완전 일치는 변형이나 추가 단어가 아닌 정확한 조건을 충족하는 문자열만 일치하는 것을 의미합니다.

Go에서 정규식을 사용하여 비밀번호를 확인하는 방법은 무엇입니까? Jun 02, 2024 pm 07:31 PM

Go에서 정규식을 사용하여 비밀번호를 확인하는 방법은 다음과 같습니다. 최소 비밀번호 요구 사항(소문자, 대문자, 숫자, 특수 문자를 포함하여 8자 이상)을 충족하는 정규식 패턴을 정의합니다. regexp 패키지의 MustCompile 함수를 사용하여 정규식 패턴을 컴파일합니다. MatchString 메서드를 사용하여 입력 문자열이 정규식 패턴과 일치하는지 테스트합니다.

정규식 와일드카드란 무엇입니까? Nov 17, 2023 pm 01:40 PM

정규식 와일드카드에는 ".", "*", "+", "?", "^", "$", "[]", "[^]", "[a-z]", "[A-Z] "가 포함됩니다. ,"[0-9]","\d","\D","\w","\W","\s&quo

한자 필터링: PHP 정규식 연습 Mar 24, 2024 pm 04:48 PM

PHP는 널리 사용되는 프로그래밍 언어이며 특히 웹 개발 분야에서 널리 사용됩니다. 웹 개발 과정에서 우리는 사용자가 입력한 텍스트를 필터링하고 검증해야 하는 경우가 종종 있는데, 그 중 문자 필터링은 매우 중요한 작업입니다. 이 기사에서는 PHP에서 정규식을 사용하여 중국어 문자 필터링을 구현하는 방법을 소개하고 구체적인 코드 예제를 제공합니다. 우선 한자의 유니코드 범위는 u4e00부터 u9fa5까지, 즉 모든 한자가 이 범위에 속한다는 점을 명확히 할 필요가 있다.

See all articles

PHP之正则表达式捕获组与非捕获组（详解）_PHP

핫 AI 도구

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

인기 기사

뜨거운 도구

메모장++7.3.1

SublimeText3 중국어 버전

스튜디오 13.0.1 보내기

드림위버 CS6

SublimeText3 Mac 버전

뜨거운 주제