经常用到的PHP正则表达达式-php手册-php.cn

Maison

php教程

php手册

经常用到的PHP正则表达达式

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 21, 2016 am 08:51 AM

quot regex str

　　思维导图

　　介绍

　　正则表达式，大家在开发中应该是经常用到，现在很多开发语言都有正则表达式的应用，比如javascript，java，.net,php等等，我今天就把我对正则表达式的理解跟大家唠唠，不当之处，请多多指教!

　　需要知道的术语——下面的术语你知道多少?

　　定界符;字符域;修饰符;限定符;脱字符;通配符(正向预查，反向预查);反向引用;惰性匹配;注释;零字符宽

　　定位

　　我们什么时候使用正则表达式呢?不是所有的字符操作都用正则就好了，php在某些方面用正则反而影响效率。当我们遇到复杂文本数据的解析时候，用正则是比较好的选择。

　　优点

　　正则表达式在处理复杂字符操作的时候，可以提高工作效率，也在一定程度节省你的代码量。

　　缺点

　　我们在使用正则表达式的时候，复杂的正则表达式会加大代码的复杂度，让人很难理解。所以我们有的时候需要在正则表达式内部添加注释。

　　通用模式

　　定界符，通常使用 "/"做为定界符开始和结束,也可以使用"#"。

　　什么时候使用"#"呢?一般是在你的字符串中有很多"/"字符的时候，因为正则的时候这种字符需要转义，比如uri。

　　使用"/"定界符的代码如下.

　　$regex = '/^http:\/\/([\w.]+)\/([\w]+)\/([\w]+)\.html$/i';

　　$str = 'http://www.youku.com/show_page/id_ABCDEFG.html';

　　$matches = array();

　　if(preg_match($regex, $str, $matches)){

　　var_dump($matches);

　　}

　　echo "\n";

　　preg_match中的$matches[0]将包含与整个模式匹配的字符串。

　　使用"#"定界符的代码如下.这个时候对"/"就不转义!

　　$regex = '#^http://([\w.]+)/([\w]+)/([\w]+)\.html$#i';

　　$str = 'http://www.youku.com/show_page/id_ABCDEFG.html';

　　$matches = array();

　　if(preg_match($regex, $str, $matches)){

　　var_dump($matches);

　　}

　　echo "\n";

　　修饰符:用于改变正则表达式的行为。

　　我们看到的('/^http:\/\/([\w.]+)\/([\w]+)\/([\w]+)\.html/i')中的最后一个"i"就是修饰符,表示忽略大小写，还有一个我们经常用到的是"x"表示忽略空格。

　　贡献代码:

　　$regex = '/HELLO/';

　　$str = 'hello word';

　　$matches = array();

　　if(preg_match($regex, $str, $matches)){

　　echo 'No i:Valid Successful!',"\n";

　　}

　　if(preg_match($regex.'i', $str, $matches)){

　　echo 'YES i:Valid Successful!',"\n";

　　}

　　字符域:[\w]用方括号扩起来的部分就是字符域。

　　限定符:如[\w]{3,5}或者[\w]*或者[\w]+这些[\w]后面的符号都表示限定符。现介绍具体意义。

　　{3,5}表示3到5个字符。{3,}超过3个字符，{,5}最多5个，{3}三个字符。* 表示0到多个，+ 表示1到多个。

　　脱字符号

　　放在字符域(如:[^\w])中表示否定(不包括的意思)——“反向选择”

　　放在表达式之前，表示以当前这个字符开始。(/^n/i,表示以n开头)。

　　注意，我们经常管"\"叫"跳脱字符"。用于转义一些特殊符号，如".","/"

　　通配符(lookarounds):断言某些字符串中某些字符的存在与否!

　　lookarounds分两种:lookaheads(正向预查 ?=)和lookbehinds(反向预查?

　　格式:

　　正向预查:(?=) 相对应的 (?!)表示否定意思;反向预查:(?

　　前后紧跟字符

　　$regex = '/(?

　　$str = 'abcdefgk';

　　$matches = array();

　　if(preg_match($regex, $str, $matches)){

　　var_dump($matches);

　　}

　　echo "\n";

　　否定意义:

　　$regex = '/(?

　　$str = 'abcdefgk';

　　$matches = array();

　　if(preg_match($regex, $str, $matches)){

　　var_dump($matches);

　　}

　　echo "\n";

　　字符宽度:零

　　验证零字符代

　　$regex = '/HE(?=L)LO/i';

　　$str = 'HELLO';

　　$matches = array();

　　if(preg_match($regex, $str, $matches)){

　　var_dump($matches);

　　}

　　echo "\n";

　　打印不出结果!

　　$regex = '/HE(?=L)LLO/i';

　　$str = 'HELLO';

　　$matches = array();

　　if(preg_match($regex, $str, $matches)){

　　var_dump($matches);

　　}

　　echo "\n";

　　能打印出结果!

　　说明:(?=L)意思是HE后面紧跟一个L字符。但是(?=L)本身不占字符，要与(L)区分，(L)本身占一个字符。

　　捕获数据

　　没有指明类型而进行的分组,将会被获取,供以后使用。

　　指明类型指的是通配符。所以只有圆括号起始位置没有问号的才能被捕捉。

　　在同一个表达式内的引用叫做反向引用。

　　调用格式: \编号(如\1)。

　　$regex = '/^(Chuanshanjia)[\w\s!]+\1$/';

　　$str = 'Chuanshanjia thank Chuanshanjia';

　　$matches = array();

　　if(preg_match($regex, $str, $matches)){

　　var_dump($matches);

　　}

　　echo "\n";

　　避免捕获数据

　　格式:(?:pattern)

　　优点:将使有效反向引用数量保持在最小，代码更加、清楚。

　　命名捕获组

　　格式:(?P) 调用方式 (?P=组名)

　　$regex = '/(?Pchuanshanjia)[\s]Is[\s](?P=author)/i';

　　$str = 'author:chuanshanjia Is chuanshanjia';

　　$matches = array();

　　if(preg_match($regex, $str, $matches)){

　　var_dump($matches);

　　}

　　echo "\n";

　　运行结果

　　惰性匹配(记住：会进行两部操作,请看下面的原理部分)

　　格式:限定符?

　　原理:"?"：如果前面有限定符，会使用最小的数据。如“*”会取0个，而“+”会取1个，如过是{3,5}会取3个。

　　先看下面的两个代码:

　　代码1.

　　$regex = '/heL*/i';

　　$str = 'heLLLLLLLLLLLLLLLL';

　　if(preg_match($regex, $str, $matches)){

　　var_dump($matches);

　　}

　　echo "\n";

　　结果1.

　　代码2

　　$regex = '/heL*?/i';

　　$str = 'heLLLLLLLLLLLLLLLL';

　　if(preg_match($regex, $str, $matches)){

　　var_dump($matches);

　　}

　　echo "\n";

　　结果2

　　代码3,使用“+”

　　$regex = '/heL+?/i';

　　$str = 'heLLLLLLLLLLLLLLLL';

　　if(preg_match($regex, $str, $matches)){

　　var_dump($matches);

　　}

　　echo "\n";

　　结果3

　　代码4,使用{3,5}

　　$regex = '/heL{3,10}?/i';

　　$str = 'heLLLLLLLLLLLLLLLL';

　　if(preg_match($regex, $str, $matches)){

　　var_dump($matches);

　　}

　　echo "\n";

　　结果4

　　正则表达式的注释

　　格式:(?# 注释内容)

　　用途:主要用于复杂的注释

　　贡献代码:是一个用于连接MYSQL数据库的正则表达式

　　 $regex = '/
　　 ^host=(?
　　 \
　　 ([\w!@#$%^&*()_+\-]+) (?#用户名)
　　 \
　　 ([\w!@#$%^&*()_+\-]+) (?#密码)
　　 (?!\)$/ix';

　　 $str = 'host=192.168.10.221root123456';
　　 $matches = array();

　　 if(preg_match($regex, $str, $matches)){
　　 var_dump($matches);
　　 }

　　 echo "\n";

　　原文链接：http://www.cnblogs.com/baochuan/archive/2012/03/12/2391135.html

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Dissolvant de vêtements AI

Video Face Swap

Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Afficher plus

Article chaud

Assassin's Creed Shadows: Solution d'énigmes de coquille

3 Il y a quelques semaines By DDD

Quoi de neuf dans Windows 11 KB5054979 et comment résoudre les problèmes de mise à jour

2 Il y a quelques semaines By DDD

Où trouver la courte de la grue à atomide atomique

3 Il y a quelques semaines By DDD

Assassin's Creed Shadows - Comment trouver le forgeron et déverrouiller les armes et la personnalisation des armes

1 Il y a quelques mois By DDD

<🎜>: Dead Rails - Comment relever chaque défi

3 Il y a quelques semaines By DDD

Afficher plus

Outils chauds

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Afficher plus

Sujets chauds

Où se trouve l'entrée de connexion pour la messagerie Gmail ?

7629

Tutoriel CakePHP

1389

Quel est le format du nom de compte de Steam

Clé d&amp;amp;amp;amp;amp;amp;#39;activation Win11 permanent

NYT Connexions Indices et réponses

141

Afficher plus

Related knowledge

php提交表单通过后,弹出的对话框怎样在当前页弹出,该如何解决 Jun 13, 2016 am 10:23 AM

php提交表单通过后,弹出的对话框怎样在当前页弹出php提交表单通过后,弹出的对话框怎样在当前页弹出而不是在空白页弹出？想实现这样的效果：而不是空白页弹出:------解决方案--------------------如果你的验证用PHP在后端，那么就用Ajax；仅供参考：HTML code

Analyse du code source str de type Python intégré May 09, 2023 pm 02:16 PM

1L'unité de base du stockage informatique Unicode est l'octet, composé de 8 bits. Étant donné que l'anglais ne comprend que 26 lettres et un certain nombre de symboles, les caractères anglais peuvent être stockés directement en octets. Mais d'autres langues (comme le chinois, le japonais, le coréen, etc.) doivent utiliser plusieurs octets pour le codage en raison du grand nombre de caractères. Avec la diffusion de la technologie informatique, la technologie de codage des caractères non latins continue de se développer, mais il existe encore deux limitations majeures : pas de support multilingue : le schéma de codage d'une langue ne peut pas être utilisé dans une autre langue et il n'existe pas de norme unifiée : par exemple, il existe de nombreuses normes d'encodage en chinois telles que GBK, GB2312, GB18030, etc. Étant donné que les méthodes d'encodage ne sont pas unifiées, les développeurs doivent effectuer des conversions entre différents encodages, et de nombreuses erreurs se produiront inévitablement.

Quelles sont les similitudes et les différences entre __str__ et __repr__ en Python ? Apr 29, 2023 pm 07:58 PM

Quelles sont les similitudes et les différences entre __str__ et __repr__ ? Nous connaissons tous la représentation des chaînes. La fonction intégrée repr() de Python peut exprimer des objets sous forme de chaînes pour faciliter notre identification. Il s'agit de la "représentation sous forme de chaîne". repr() obtient la représentation sous forme de chaîne d'un objet via la méthode spéciale __repr__. Si __repr__ n'est pas implémenté, lorsque nous imprimons une instance d'un vecteur sur la console, la chaîne résultante peut l'être. >>>classExample:pass>>>print(str(Example()))>>>

Comment utiliser l'expression régulière RegEx de Python May 19, 2023 pm 08:49 PM

RegEx ou expression régulière est une séquence de caractères qui forme un modèle de recherche. RegEx peut être utilisé pour vérifier si une chaîne contient un modèle de recherche spécifié. Module RegEx Python fournit un package intégré appelé re qui peut être utilisé pour traiter les expressions régulières. Importez le module re : importre RegEx en Python Une fois que vous avez importé le module re, vous pouvez commencer à utiliser des expressions régulières : Exemple Récupérer une chaîne pour voir si elle commence par « China » et se termine par « country » : importretxt="Chinaisagreatcountry" x =re .search("^Chine.*pays$&

不用数据库来实现用户的简单的下载，代码如下，但是却不能下载，请高手找下原因，文件路劲什么的没有关问题 Jun 13, 2016 am 10:15 AM

不用数据库来实现用户的简单的下载，代码如下，但是却不能下载，请高手找下原因，文件路劲什么的没问题。

图片消失怎么解决 Apr 07, 2024 pm 03:02 PM

图片消失如何解决先是图片文件上传$file=$_FILES['userfile']; if(is_uploaded_file($file['tmp_name'])){$query=mysql_query("INSERT INTO gdb_banner(image_src ) VALUES ('images/{$file['name'

图片消失怎么解决 Jun 13, 2016 am 10:09 AM

图片消失如何解决先是图片文件上传$file=$_FILES['userfile']; if(is_uploaded_file($file['tmp_name'])){$query=mysql_query("INSERT INTO gdb_banner(image_src ) VALUES ('images/{$file['name'

Révéler le secret de str en langage Go Mar 29, 2024 am 11:27 AM

Le langage Go est un langage de programmation open source rapide, concis et efficace, qui devient de plus en plus populaire parmi les programmeurs. La chaîne est l'un des types de données fréquemment utilisés dans les programmes et dispose également d'une méthode de traitement unique dans le langage Go. Cet article amènera les lecteurs à découvrir le mystère des chaînes (str) dans le langage Go et à analyser son utilisation et ses caractéristiques à travers des exemples de code spécifiques. Définition et initialisation d'une chaîne En langage Go, une chaîne est une séquence de caractères entourée de guillemets "", par exemple : str

See all articles