PHP 正規表現入門チュートリアル [翻訳済み]-PHPチュートリアル-php.cn

ホームページ

バックエンド開発

PHPチュートリアル

PHP 正規表現入門チュートリアル [翻訳済み]

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 23, 2016 pm 02:37 PM

マインドマップ

具体的なコンテンツを表示するには、下の画像をクリックしてください。

開発では正規表現を頻繁に使用する必要があります。現在、JavaScript、Java、.net、php などの多くの開発言語に正規表現アプリケーションがあることを理解しています。みんなと雑談中不適切だったら言ってください！

知っておくべき用語次の用語についてどれくらい知っていますか? (順方向プレビュー、逆方向lookup)

Δ 後方参照

Δ 遅延マッチング

Δ コメント

Δ 文字幅ゼロ

正規表現はいつ使用しますか?すべての文字操作に正規表現を使用するだけでは十分ではありません。PHP はいくつかの側面で正規表現を使用しますが、これは実際に効率に影響します。複雑なテキストデータの解析が必要な場合は、正規表現を使用することをお勧めします。

正規表現を使用すると、複雑な文字操作を扱う際の作業効率が向上し、コードをある程度節約できます。

正規表現を使用する場合、複雑な正規表現によってコードが複雑になり、理解しにくくなります。そのため、正規表現内にコメントを追加する必要がある場合があります。

一般モード

¤ 区切り文字、通常は開始と終了の区切り文字として「/」を使用しますが、「#」も使用できます。

「#」を使用するのはどのような場合ですか? 一般に、文字列に「/」文字が多数ある場合です。これは、uri などの正規表現でそのような文字をエスケープする必要があるためです。

「/」区切り文字を使用したコードは次のとおりです

$regex = '/^http:\/\/([\w.]+)\/([\w]+)\/([\w]+)\.html$/i';$str = 'http://www.youku.com/show_page/id_ABCDEFG.html';$matches = array();if(preg_match($regex, $str, $matches)){    var_dump($matches);}echo "\n";

ログイン後にコピー

preg_match の $matches[0] には、パターン全体に一致する文字列が含まれます。

「#」区切り文字を使用したコードは以下の通りです

$regex = '#^http://([\w.]+)/([\w]+)/([\w]+)\.html$#i';$str = 'http://www.youku.com/show_page/id_ABCDEFG.html';$matches = array();if(preg_match($regex, $str, $matches)){    var_dump($matches);}echo "\n";

ログイン後にコピー

¤ 修飾子: 正規表現の動作を変更するために使用されます。

('/^http://([w.]+)/([w]+)/([w]+).html/i') の最後の「i」は修飾記号です。これは大文字と小文字を無視することを意味し、私たちがよく使うもう 1 つの文字はスペースを無視することを意味する「x」です。

投稿コード:

$regex = '/HELLO/';$str = 'hello word';$matches = array();if(preg_match($regex, $str, $matches)){    echo 'No i:Valid Successful!',"\n";}if(preg_match($regex.'i', $str, $matches)){    echo 'YES i:Valid Successful!',"\n";}

ログイン後にコピー

¤ 文字フィールド: [w] 角括弧で展開された部分が文字フィールドです。

¤ 修飾子: [w]{3,5}、[w]*、または [w]+ など、[w] の後の記号はすべて修飾子を表します。具体的な意味をご紹介します。

{3,5} は 3 ～ 5 文字を意味します。 {3,} は 3 文字を超え、{,5} は最大 5 文字、{3} は 3 文字です。到0 *は0から複数

+1から複数を示します。

¤ キャレット記号

式の前では、現在の文字から始めることを意味します。 (/^n/i、n で始まることを意味します)。

注、「」は「エスケープ文字」と呼ばれることがよくあります。「.」、「/」などの特殊記号をエスケープするために使用されます

ワイルドカード (ルックアラウンド): 特定の文字列内の特定の文字の有無をアサートします。

ルックアラウンドには、先読み (前方参照 ?=) と後読み (逆引き ?<=) の 2 種類があります。

> 形式:

前方参照: (?=) 対応する (?!) は否定的な意味を意味します

逆引き参照: (?<=) 対応する (?

文字

$regex = '/(?<=c)d(?=e)/';  /* d 前面紧跟c, d 后面紧跟e*/$str = 'abcdefgk';$matches = array();if(preg_match($regex, $str, $matches)){    var_dump($matches);}echo "\n";

ログイン後にコピー

否定的な意味:

$regex = '/(?<!c)d(?!e)/';  /* d 前面不紧跟c, d 后面不紧跟e*/$str = 'abcdefgk';$matches = array();if(preg_match($regex, $str, $matches)){    var_dump($matches);}echo "\n";

ログイン後にコピー

>文字幅: ゼロ

验证零字符代码

$regex = '/HE(?=L)LO/i';$str = 'HELLO';$matches = array();if(preg_match($regex, $str, $matches)){    var_dump($matches);}echo "\n";

ログイン後にコピー

打印不出结果！

$regex = '/HE(?=L)LLO/i';$str = 'HELLO';$matches = array();if(preg_match($regex, $str, $matches)){    var_dump($matches);}echo "\n";

ログイン後にコピー

能打印出结果!

说明:(?=L)意思是HE后面紧跟一个L字符。但是(?=L)本身不占字符，要与(L)区分，（L）本身占一个字符。

捕获数据

没有指明类型而进行的分组,将会被获取,供以后使用。

> 指明类型指的是通配符。所以只有圆括号起始位置没有问号的才能被捕捉。

> 在同一个表达式内的引用叫做反向引用。

> 调用格式: \编号(如\1)。

$regex = '/^(Chuanshanjia)[\w\s!]+\1$/';    $str = 'Chuanshanjia thank Chuanshanjia';$matches = array();if(preg_match($regex, $str, $matches)){    var_dump($matches);}echo "\n";

ログイン後にコピー

> 避免捕获数据

格式:(?:pattern)

优点:将使有效反向引用数量保持在最小，代码更加、清楚。

>命名捕获组

格式:(?P<组名>) 调用方式 (?P=组名)

$regex = '/(?P<author>chuanshanjia)[\s]Is[\s](?P=author)/i';$str = 'author:chuanshanjia Is chuanshanjia';$matches = array();if(preg_match($regex, $str, $matches)){    var_dump($matches);}echo "\n";

ログイン後にコピー

运行结果

惰性匹配(记住：会进行两部操作,请看下面的原理部分)

　格式:限定符?

原理:"?"：如果前面有限定符，会使用最小的数据。如“*”会取0个，而“+”会取1个，如过是{3,5}会取3个。

先看下面的两个代码:

代码1.

<?php$regex = '/heL*/i';$str = 'heLLLLLLLLLLLLLLLL';if(preg_match($regex, $str, $matches)){    var_dump($matches);}echo "\n";

ログイン後にコピー

结果1.

代码2

<?php$regex = '/heL*?/i';$str = 'heLLLLLLLLLLLLLLLL';if(preg_match($regex, $str, $matches)){    var_dump($matches);}echo "\n";

ログイン後にコピー

结果2

代码3,使用“+”

<?php$regex = '/heL+?/i';$str = 'heLLLLLLLLLLLLLLLL';if(preg_match($regex, $str, $matches)){    var_dump($matches);}echo "\n";

ログイン後にコピー

结果3

代码4,使用{3,5}

<?php$regex = '/heL{3,10}?/i';$str = 'heLLLLLLLLLLLLLLLL';if(preg_match($regex, $str, $matches)){    var_dump($matches);}echo "\n";

ログイン後にコピー

结果4

正则表达式的注释

格式:(?# 注释内容)

用途:主要用于复杂的注释

贡献代码:是一个用于连接MYSQL数据库的正则表达式

$regex = '/    ^host=(?<!\.)([\d.]+)(?!\.)                 (?#主机地址)\|    ([\w!@#$%^&*()_+\-]+)                       (?#用户名)\|    ([\w!@#$%^&*()_+\-]+)                       (?#密码)(?!\|)$/ix';$str = 'host=192.168.10.221|root|123456';$matches = array();if(preg_match($regex, $str, $matches)){    var_dump($matches);}echo "\n";

ログイン後にコピー

特殊字符

特殊字符	解释
*	0到多次
+	1到多次还可以写成{1,}
?	0或1次
.	匹配除换行符外的所有单个的字符
\w	[a-zA-Z0-9_]
\s	空白字符(空格，换行符，回车符）[\t\n\r]
\d	[0-9]

原文：http://www.cnblogs.com/baochuan/archive/2012/03/12/2391135.html

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

ホットトピック

Gmailメールのログイン入り口はどこですか？

7698

Java チュートリアル

1640

CakePHP チュートリアル

1393

Laravel チュートリアル

1287

PHP チュートリアル

1229

Related knowledge

Alipay PHP SDK転送エラー：「クラスの看板を宣言できない」という問題を解決する方法は？ Apr 01, 2025 am 07:21 AM

Alipay Php ...

JSON Web Tokens（JWT）とPHP APIでのユースケースを説明してください。 Apr 05, 2025 am 12:04 AM

JWTは、JSONに基づくオープン標準であり、主にアイデンティティ認証と情報交換のために、当事者間で情報を安全に送信するために使用されます。 1。JWTは、ヘッダー、ペイロード、署名の3つの部分で構成されています。 2。JWTの実用的な原則には、JWTの生成、JWTの検証、ペイロードの解析という3つのステップが含まれます。 3. PHPでの認証にJWTを使用する場合、JWTを生成および検証でき、ユーザーの役割と許可情報を高度な使用に含めることができます。 4.一般的なエラーには、署名検証障害、トークンの有効期限、およびペイロードが大きくなります。デバッグスキルには、デバッグツールの使用とロギングが含まれます。 5.パフォーマンスの最適化とベストプラクティスには、適切な署名アルゴリズムの使用、有効期間を合理的に設定することが含まれます。

セッションのハイジャックはどのように機能し、どのようにPHPでそれを軽減できますか？ Apr 06, 2025 am 12:02 AM

セッションハイジャックは、次の手順で達成できます。1。セッションIDを取得します。2。セッションIDを使用します。3。セッションをアクティブに保ちます。 PHPでのセッションハイジャックを防ぐための方法には次のものが含まれます。1。セッション_regenerate_id（）関数を使用して、セッションIDを再生します。2。データベースを介してストアセッションデータを3。

確固たる原則と、それらがPHP開発にどのように適用されるかを説明してください。 Apr 03, 2025 am 12:04 AM

PHP開発における固体原理の適用には、次のものが含まれます。1。単一責任原則（SRP）：各クラスは1つの機能のみを担当します。 2。オープンおよびクローズ原理（OCP）：変更は、変更ではなく拡張によって達成されます。 3。Lischの代替原則（LSP）：サブクラスは、プログラムの精度に影響を与えることなく、基本クラスを置き換えることができます。 4。インターフェイス分離原理（ISP）：依存関係や未使用の方法を避けるために、細粒インターフェイスを使用します。 5。依存関係の反転原理（DIP）：高レベルのモジュールと低レベルのモジュールは抽象化に依存し、依存関係噴射を通じて実装されます。