PHP 正規表現マッチングの具体的な実装は何ですか?実際、実際のマッチング操作では、操作するのは単一の文字や数字だけではないことがわかっています。では、単語や数字のグループをどのように扱うべきでしょうか?
PHP 正規表現マッチングの特定の実装では、PHP 正規表現の組み込みユニバーサル文字クラスターが使用されます。PHP 正規表現の組み込みユニバーサル文字セットとは何ですか?
PHP 正規表現の組み込みユニバーサル文字セットと意味:
<ol class="dp-c"> <li class="alt"><span><span>[[:alpha:]] </span><span class="comment">//任何字母 </span><span> </span></span></li> <li> <span>[[:digit:]] </span><span class="comment">//任何数字 </span><span> </span> </li> <li class="alt"> <span>[[:alnum:]] </span><span class="comment">//任何字母和数字 </span><span> </span> </li> <li> <span>[[:space:]] </span><span class="comment">//任何白字符 </span><span> </span> </li> <li class="alt"> <span>[[:upper:]] </span><span class="comment">//任何大写字母 </span><span> </span> </li> <li> <span>[[:lower:]] </span><span class="comment">//任何小写字母 </span><span> </span> </li> <li class="alt"> <span>[[:punct:]] </span><span class="comment">//任何标点符号 </span><span> </span> </li> <li> <span>[[:xdigit:]] </span><span class="comment">//任何16进制的数字,相当于[0-9a-fA-F] </span><span> </span> </li> </ol>
PHP 正規表現のマッチングの分析:
ここまでで、文字または数字を照合する方法はすでに理解しましたが、さらに多くの状況があります。次に、単語または数字のグループを一致させたい場合があります。単語は複数の文字で構成され、数字のグループは複数の単数で構成されます。文字または文字クラスターに続く中括弧 ({}) は、前のコンテンツが繰り返される回数を決定するために使用されます。
使用される PHP 正規表現の文字セットと意味
<ol class="dp-c"> <li class="alt"><span><span>^[a-zA-Z_]$ </span><span class="comment">//所有的字母和下划线 </span><span> </span></span></li> <li> <span>^[[:alpha:]]{3}$ </span><span class="comment">//所有的3个字母的单词 </span><span> </span> </li> <li class="alt"> <span>^a$ </span><span class="comment">//字母a </span><span> </span> </li> <li> <span>^a{4}$ </span><span class="comment">//aaaa </span><span> </span> </li> <li class="alt"> <span>^a{2,4}$ </span><span class="comment">//aa,aaa或aaaa </span><span> </span> </li> <li> <span>^a{1,3}$ </span><span class="comment">//a,aa或aaa </span><span> </span> </li> <li class="alt"> <span>^a{2,}$ </span><span class="comment">//包含多于两个a的字符串 </span><span> </span> </li> <li> <span>^a{2,} </span><span class="comment">//如:aardvark和aaab,但apple不行 </span><span> </span> </li> <li class="alt"> <span>a{2,} </span><span class="comment">//如:baad和aaa,但Nantucket不行 </span><span> </span> </li> <li> <span>t{2} </span><span class="comment">//两个制表符 </span><span> </span> </li> <li class="alt"> <span>.{2} </span><span class="comment">//所有的两个字符 </span><span> </span> </li> </ol>
これらの例では、中括弧の 3 つの異なる使用法を説明します。数値 {x} は、「前の文字または文字クラスターが x 回のみ出現する」ことを意味し、数値とコンマ {x,} は、「前のコンテンツが x 回以上出現する」ことを意味します。 ,y} は、「前のコンテンツが少なくとも x 回表示されますが、y 回を超えない」ことを意味します。このパターンをさらに多くの単語や数字に拡張することができます:
<ol class="dp-c"> <li class="alt"><span><span>^[a-zA-Z0-9_]{1,}$ </span><span class="comment">//所有包含一个以上的字母、数字或下划线的字符串 </span><span> </span></span></li> <li> <span>^[0-9]{1,}$ </span><span class="comment">//所有的正数 </span><span> </span> </li> <li class="alt"> <span>^-{0,1}[0-9]{1,}$ </span><span class="comment">//所有的整数 </span><span> </span> </li> <li> <span>^-{0,1}[0-9]{0,}.{0,1}[0-9]{0,}$ </span><span class="comment">//所有的小数 </span><span> </span> </li> </ol>
最後の例は理解するのが簡単ではありませんね。このように見てください。すべてがオプションの負符号 (-{0,1}) (^) で始まり、その後に 0 個以上の数字 ([0-9]{0,})、およびオプションの小数点 A が続きます。 (.{0,1}) の後に 0 個以上の数字 ([0-9]{0,}) が続き、それ以外は何もありません ($)。以下では、使用できるより簡単な方法について説明します。
特殊文字「?」は {0,1} に等しく、両方とも「0 または 1 つの前のコンテンツ」または「前のコンテンツはオプション」を表します。したがって、今の例は次のように簡略化できます:
<ol class="dp-c"><li class="alt"><span><span>^-?[0-9]{0,}.?[0-9]{0,}$ </span></span></li></ol>
特殊文字「*」と {0,} は等しく、両方とも「0 個以上の前のコンテンツ」を表します。最後に、文字「+」は {1,} に等しく、これは「1 つ以上の前のコンテンツ」を意味するため、上記の 4 つの例は次のように書くことができます:
<ol class="dp-c"> <li class="alt"><span><span>^[a-zA-Z0-9_]+$ </span></span></li> <li> <span class="comment">//所有包含一个以上的字母、数字或下划线的字符串 </span><span> </span> </li> <li class="alt"> <span>^[0-9]+$ </span><span class="comment">//所有的正数 </span><span> </span> </li> <li> <span>^-?[0-9]+$ </span><span class="comment">//所有的整数 </span><span> </span> </li> <li class="alt"> <span>^-?[0-9]*.?[0-9]*$ </span><span class="comment">//所有的小数 </span><span> </span> </li> </ol>
もちろん、これは技術的に正規表現の複雑さを軽減するものではありません。しかし、読みやすくすることはできます。
ここでは、PHP 正規表現マッチングの具体的な実装について紹介します。PHP 正規表現マッチングの具体的な実装を理解し、学習するのに役立つことを願っています。