Das Trennzeichen regulärer Ausdrücke
$正则表达式$ %正则表达式% /正则表达式/
/
ein Escape-Zeichen ist. Wenn wir im regulären Ausdruck mit / übereinstimmen müssen, können wir Escape verwenden . Wenn Sie Schwierigkeiten haben, können Sie direkt andere Trennzeichen verwenden, z. B.: /
是转义字符,当我们正则中需要匹配/的时候,可以使用转义一下。如果觉得麻烦的话,可以直接使用其他的定界符比如:
$/$
正则表达式的原子
正则表达式的原子是正则表达式里的最小单位,也就是我们需要匹配的内容,在我们成立的整形额表达式中,最少也要有一个原子。
其实可以理解为,所有可见的不可见的字符都是原子,比如空格、回车、换行、0-9、标点符号、A-Za-z、中文这些都是原子。
preg_match() 函数
在详细的讲原子之前,我们要先了解一下一个函数,那就是preg_match
PHP 中的 preg_match() 函数可以根据定义的正则表达式对字符串进行搜索以及匹配。
语法格式如下:
preg_match ( string $正则 , string $字符串 [, array &$结果] )
根据$正则也就是我们定义的正则表达式,在匹配$字符串,如果存在则返回匹配个数,然后把匹配的结果放在$结果里。如果没有匹配到结果那就返回0。
我们通过示例来看一下:
<?php //定义一个变量叫a,作为我们定义的正则表达式。 $a = '/a/'; $b = 'abbcccddddeeeee'; if(preg_match($a, $b, $c)){ echo '匹配到了,结果为:'; var_dump($c); }else{ echo '没有匹配到'; } ?>
输出结果:
由上述示例可以看出,我们定义了变量a,希望能够匹配的是a,正好在$b中存在a,通过if else语句输出成功了。
再来一个示例:
<?php //定义一个变量叫a,作为我们定义的正则表达式。 $a = '/fff/'; $b = 'abbcccddddeeeee'; if(preg_match($a, $b, $c)){ echo '匹配到了,结果为:'; var_dump($c); }else{ echo '没有匹配到'; } ?>
输出结果:
上述示例中,希望匹配到字符串,但是$b中不存在,所以没有匹配成功,通过if else语句输出为匹配成功。
知道了preg_match() 函数的基本用法之后我们可以和特殊标识的原子结合起来使用。
特殊标识的原子
d
---匹配一个0-9
D
---除了0-9以外的所有字符
w
---a-zA-Z0-9_
W-
--除了0-9A-Za-z_以外的所有字符
s
---匹配所有空白字符n t r 空格
S
---匹配所有非空白字符
[ ]
---指定范围的原子
它们的具体用法给大家举个例子就明白了:
<?php $a = '/\d/'; $b = '人生自古谁无4'; if(preg_match($a, $b, $c)){ echo '匹配到了,结果为:'; var_dump($c); }else{ echo '没有匹配到'; } ?>
输出结果:
在上述示例中,特殊标识的原子d表示的就是0-9的数字,那么在需要匹配的$b中存在一个4,所以匹配成功。
<?php $a = '/\w/'; $b = '人生自古谁无死'; if(preg_match($a, $b, $c)){ echo '匹配到了,结果为:'; var_dump($c); }else{ echo '没有匹配到'; } ?>
输出结果:
在上述实例中,特殊标识的原子w表示的是a-zA-Z0-9_ ,在变量b中没有相应的元素,所以输出结果为未匹配到。
其中还有一个[^]
<?php $a = '/[^0-9A-Za-z_]/'; $b = 'abbccc122333'; if(preg_match($a, $b, $c)){ echo '匹配到了,结果为:'; var_dump($c); }else{ echo '没有匹配到'; } ?>
Atome regulärer Ausdrücke
Atome regulärer Ausdrücke sind die kleinsten Einheiten in regulären Ausdrücken, die wir in unserem etablierten System anpassen müssen Ganzzahliger Ausdruck, es muss mindestens ein Atom vorhanden sein.
preg_match
🎜🎜Die preg_match()-Funktion in PHP kann entsprechend ausgedrückt werden Definierter regulärer Ausdruck. Zeichenfolgen suchen und abgleichen. 🎜🎜Das Syntaxformat lautet wie folgt: 🎜<?php $a = '/\d+/'; $b = "爱你10000年"; if(preg_match($a, $b, $c)){ echo '匹配到了,结果为:'; var_dump($c); }else{ echo '没有匹配到'; } ?>
<?php $a = '/ABC/i'; $b = '8988abc12313'; $c = '11111ABC2222'; if(preg_match($a, $b, $d)){ echo '匹配到了,结果为:'; var_dump($d); }else{ echo '没有匹配到'; } ?>
<?php $a = '/ABC/i'; $b = '8988abc12313'; $c = '11111ABC2222'; if(preg_match($a, $c, $d)){ echo '匹配到了,结果为:'; var_dump($d); }else{ echo '没有匹配到'; } ?>
d
---entspricht einer 0-9 🎜🎜🎜🎜D
---alle außer 0-9 Zeichen 🎜🎜 🎜🎜w
---a-zA-Z0-9_ 🎜🎜🎜🎜W-
--alle außer 0-9A-Za-z_ Zeichen 🎜🎜🎜🎜< code>s---übereinstimmt mit allen Leerzeichen und Leerzeichen 🎜🎜🎜🎜S
---übereinstimmt mit allen Nicht-Leerzeichen 🎜🎜🎜🎜[ ]
---Spezifizierter Atombereich 🎜🎜🎜🎜Ihre spezifische Verwendung wird anhand eines Beispiels erklärt: 🎜🎜rrreee🎜Ausgabeergebnis: 🎜🎜🎜🎜🎜Im obigen Beispiel stellt das speziell identifizierte Atom d die Zahl 0-9 dar, dann gibt es eine 4 in $b, das abgeglichen werden muss, damit die Übereinstimmung erfolgreich ist. 🎜rrreee🎜Ausgabeergebnis: 🎜🎜🎜🎜🎜Im obigen Beispiel stellt das speziell identifizierte Atom w a-zA-Z0-9_ dar und es gibt kein entsprechendes Element in der Variablen b, sodass das Ausgabeergebnis nicht übereinstimmt. 🎜🎜Es gibt auch ein [^]
-Zeichen, das Zeichen angibt, die nicht mit dem angegebenen Intervall übereinstimmen. 🎜🎜Das Beispiel sieht wie folgt aus: 🎜rrreee🎜Ausgabeergebnis: 🎜🎜通过[^]字符匹配除0-9A-Za-z_以外的字符,未匹配到。
总结一下:
\w
---[a-zA-Z0-9_]
\W
---[^a-zA-Z0-9_]
\d
---[0-9]
\D
---[^0-9]
\s
---[ \t\n\f\r]
\S
---[^ \t\n\f\r]
正则表达式的元字符
在上面的示例中,我们能够看出通过匹配的话,只能匹配一个字符,但是在我们的日常使用中,通常会匹配多个字符,那这时候只通过我们的原子就不能达到我们的目的。就需要通过元字符来帮我们修饰原子,实现更多的功能。
*
---代表匹配前面的一个原子,匹配0次或者任意多次前面的字符。
+
---匹配一次或多次前面的一个字符
?
---前面的字符可有可无【可选】 有或没有
.
---更标准一些应该把点算作原子。匹配除了\n以外的所有字符 或者。注:它的优先级最低了。
^
---必须要以抑扬符之后的字符串开始
$
--- 必须要以$之前的字符结尾
\b
---词边界
\B
---非边界
{m}
---有且只能出现m次
{n,m}
---可以出现n到m次
{m,}
---至少m次,最大次数不限制
()
---改变优先级或者将某个字符串视为一个整体,匹配到的数据取出来也可以使用它
接下来我们通过一些例子来实例看一下这些元字符的使用:
<?php $a = '/\d+/'; $b = "爱你10000年"; if(preg_match($a, $b, $c)){ echo '匹配到了,结果为:'; var_dump($c); }else{ echo '没有匹配到'; } ?>
输出结果:
通过元字符+的添加,匹配到了多次字符,\d+中d是匹配数字,+则表示最少匹配一次前面的字符。
正则表达式的模式修正符
通过原子和元字符的了解,我们已经完成了正则表达式的入门,但是这仍然不能代表正则表达式的真正实力,如果我们只希望正则表达式匹配一部分应该怎么办?有些特殊情况依然需要处理,这时候我们就要用到正则表达式的模式修正符。
下面列举一些常用的模式修正符:
i 模式中的字符将同时匹配大小写字母.
m 字符串视为多行
s 将字符串视为单行,换行符作为普通字符.
x 将模式中的空白忽略.
A 强制仅从目标字符串的开头开始匹配.
D 模式中的美元元字符仅匹配目标字符串的结尾.
U 匹配最近的字符串.
它的用法如下:
/正则表达式/模式修正符
接下来我们通过一些实例来看一下它的使用:
<?php $a = '/ABC/i'; $b = '8988abc12313'; $c = '11111ABC2222'; if(preg_match($a, $b, $d)){ echo '匹配到了,结果为:'; var_dump($d); }else{ echo '没有匹配到'; } ?>
输出结果:
i可以让匹配的时候同时匹配大小写,那么接下来把匹配的$b换成$c试一下,我们看一下输出结果:
<?php $a = '/ABC/i'; $b = '8988abc12313'; $c = '11111ABC2222'; if(preg_match($a, $c, $d)){ echo '匹配到了,结果为:'; var_dump($d); }else{ echo '没有匹配到'; } ?>
输出结果:
推荐学习:《PHP视频教程》
Das obige ist der detaillierte Inhalt vonDie spannenden Grundlagen regulärer Ausdrücke in PHP (ausführliche Erklärung mit Abbildungen). Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!