PHP之正则表达式捕获组与非捕获组（详解）

ホームページ

バックエンド開発

PHPチュートリアル

PHP之正则表达式捕获组与非捕获组（详解）_PHP

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

May 30, 2016 am 08:47 AM

正規表現

在项目开发过程中正则表示经常会用到，可以说会正则表达式是每个程序员最基本的要求，初学者在刚接触正则表达式都感到很吃力。最近看到一位朋友的博客写的《PHP正则表达式》获益颇多，在章节对通配符以及捕获数据非常感兴趣。这两章节刚好也涉及到了正则表达式的捕获组和非捕获组的内容，以此来分析这方面的内容

　　我们知道，在正则表达式下(x) 表示匹配'x'并记录匹配的值。这只是比较通俗的说法，甚至说这是不严谨的说法，只有（）捕获组形式才会记录匹配的值。非捕获组则只匹配，不记录。

　　捕获组：

　　(pattern)

这种形式是我们见到最多的一种形式，匹配并返回捕获结果，可以嵌套，组号顺序从左到右依次排列‘。

代码如下:

$regex = '/(ab(c)+)+d(e)?/';
$str = 'abccde';
$matches = array();

if(preg_match($regex, $str, $matches)){
print_r($matches);
}

　　匹配结果：

代码如下:

Array ( [0] => abccde [1] => abcc [2] => c [3] => e )
　　(?Ppattern)

这种方式虽然看起来在构造正则表达式的时候略微复杂一点，但实质上与(pattern)一样。最大的优势体现在对结果处理上，程序员可以直接根据自己设置的直接快速调用结果，而不用再去数需要的结果在第几个子组了。

代码如下:

$regex = '/(?P\w(?P\w))abc(?P\w)45/';

$str = 'fsabcd45';
$matches = array();

if(preg_match($regex, $str, $matches)){
print_r($matches);
}

　　匹配结果：

代码如下:

Array ( [0] => fsabcd45 [group1] => fs [1] => fs [group2] => s [2] => s [group3] => d [3] => d )
　　\num

num是一个整数，是对捕获组的反向引用。例如\2表示第二个子组匹配值，\表示第一个子组匹配值

代码如下:

$regex = '/(\w)(\w)\2\1/';
$str = 'abba';
$matches = array();

if(preg_match($regex, $str, $matches)){
print_r($matches);
}

　　匹配结果：

代码如下:

Array ( [0] => abba [1] => a [2] => b )

注意，这里我疏忽了一个小细节，一开始我第一样代码是 $regex = “/(\w)(\w)\2\1/”; 结果返回无匹配结果，经过调试后，发现这里只能用' '。'与" 用法差别大家还是需要注意下。

　　了解了(?Ppattern)与\num，这个就不难理解了。\k是对命名捕获组的反向引用。其中 name 是捕获组名。

代码如下:

$regex='/(?P\w)abc\k/';

$str="fabcf";

echo preg_match_all($regex, $str,$matches);

print_r($matches);

　　匹配结果：

代码如下:

Array ( [0] => Array ( [0] => fabcf ) [name] => Array ( [0] => f ) [1] => Array ( [0] => f ) )

　　非捕获组：

　　(?:pattern)

　　与(pattern)的唯一区别是，匹配pattern但不捕获匹配结果。这里便不再举例。

　　还有四种方式实际上讲的是一个事情：预查。

　　预查分为正向预查与反向预查。根据字面理解，正向预查是判断匹配字符串后面某些字符存在与否，而反向预查则是判断匹配字符串前面某些字符存在与否。

　　正向预查判断存在使用(?=pattern)，判断不存在使用(?!pattern)。

　　反向预查判断存在使用(?

代码如下:

$regx='/(?
$str="abcd ebcd abce ebca";

if(preg_match_all($regx, $str, $matches)){

print_r($matches);
}

　　匹配结果：

代码如下:

Array ( [0] => Array ( [0] => bc) )

　　这四种形式使用的是否只要注意好相对匹配字符串的位置和断言肯定还是否定，就会很快掌握。

　　另外，预查的四种形式是零宽度的，匹配的时候只做一个判断，本身是不占位置的。/HE(?=L)LLO/ 与HELLO匹配，而/HE(?=L)LO/与HELLO是不匹配的。毕竟但从字节数上两者就是不匹配的，前者只有4个，而后者有5个。

以上就是PHP之正则表达式捕获组与非捕获组详解的全部内容，希望对大家有所启迪。

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

ホットトピック

Gmailメールのログイン入り口はどこですか？

7640

CakePHP チュートリアル

1391

Steamのアカウント名の形式は何ですか

Win11 Activation Key Permanent

NYTの接続はヒントと回答です

150

Related knowledge

PHP 正規表現の検証: 数値形式の検出 Mar 21, 2024 am 09:45 AM

PHP 正規表現の検証: 数値形式の検出 PHP プログラムを作成する場合、ユーザーが入力したデータを検証する必要がよくあります。一般的な検証の 1 つは、データが指定された数値形式に準拠しているかどうかを確認することです。 PHP では、正規表現を使用してこの種の検証を行うことができます。この記事では、PHP 正規表現を使用して数値形式を検証する方法を紹介し、具体的なコード例を示します。まず、一般的な数値形式の検証要件を見てみましょう。整数: 0 ～ 9 の数字のみが含まれ、プラスまたはマイナス記号で始めることができ、小数点は含まれません。浮動小数点

正規表現を使用して Golang でメールアドレスを検証するにはどうすればよいですか? May 31, 2024 pm 01:04 PM

正規表現を使用して Golang で電子メールアドレスを検証するには、次の手順に従います。 regexp.MustCompile を使用して、有効な電子メールアドレス形式と一致する正規表現パターンを作成します。 MatchString 関数を使用して、文字列がパターンと一致するかどうかを確認します。このパターンは、次のようなほとんどの有効な電子メールアドレス形式をカバーします。ローカルユーザー名には文字、数字、および特殊文字を含めることができます: !.#$%&'*+/=?^_{|}~-` ドメイン名には少なくとも次の文字が含まれている必要があります。 1 文字の後に文字、数字、またはハイフンを続けます。トップレベルドメイン (TLD) は 63 文字を超えることはできません。

Go で正規表現を使用してタイムスタンプを照合するにはどうすればよいですか? Jun 02, 2024 am 09:00 AM

Go では、正規表現を使用してタイムスタンプを照合できます。ISO8601 タイムスタンプの照合に使用されるような正規表現文字列をコンパイルします。 ^\d{4}-\d{2}-\d{2}T \d{ 2}:\d{2}:\d{2}(\.\d+)?(Z|[+-][0-9]{2}:[0-9]{2})$ 。 regexp.MatchString 関数を使用して、文字列が正規表現と一致するかどうかを確認します。

Go言語の正規表現と文字列処理をマスターする Nov 30, 2023 am 09:54 AM

最新のプログラミング言語として、Go 言語は強力な正規表現と文字列処理関数を提供し、開発者が文字列データをより効率的に処理できるようにします。開発者にとって、Go 言語での正規表現と文字列処理を習得することは非常に重要です。この記事では、Go 言語の正規表現の基本概念と使い方、Go 言語を使用して文字列を処理する方法を詳しく紹介します。 1. 正規表現正規表現は文字列のパターンを記述するためのツールであり、文字列の照合、検索、置換などの操作を簡単に実装できます。

PHP 正規表現: 厳密な一致とあいまいな包含の除外 Feb 28, 2024 pm 01:03 PM

PHP 正規表現: 完全一致と除外ファジー包含正規表現は、プログラマがテキストを処理する際に効率的な検索、置換、フィルタリングを実行できる強力なテキストマッチングツールです。 PHP では、正規表現は文字列処理やデータマッチングにも広く使用されています。この記事では、PHP で完全一致を実行し、あいまい包含操作を除外する方法に焦点を当て、具体的なコード例を使用して説明します。完全一致完全一致とは、バリエーションや余分な単語ではなく、正確な条件を満たす文字列のみと一致することを意味します。

Goで正規表現を使用してパスワードを確認するにはどうすればよいですか? Jun 02, 2024 pm 07:31 PM

Go で正規表現を使用してパスワードを検証する方法は次のとおりです。パスワードの最小要件 (小文字、大文字、数字、特殊文字を含む少なくとも 8 文字) を満たす正規表現パターンを定義します。 regexp パッケージの MustCompile 関数を使用して正規表現パターンをコンパイルします。 MatchString メソッドを使用して、入力文字列が正規表現パターンと一致するかどうかをテストします。

漢字フィルタリング: PHP 正規表現の練習 Mar 24, 2024 pm 04:48 PM

PHP は広く使用されているプログラミング言語であり、特に Web 開発の分野で人気があります。 Web開発の過程では、ユーザーが入力したテキストをフィルタリングして検証する必要がよくありますが、その中でも文字フィルタリングは非常に重要な操作です。この記事では、PHP で正規表現を使用して漢字フィルタリングを実装する方法と、具体的なコード例を紹介します。まず最初に、Unicode の漢字の範囲は u4e00 から u9fa5 までである、つまりすべての漢字がこの範囲内にあることを明確にする必要があります。