PHP正则表达式入门教程(推荐)_php实例
思维导图
点击下图,可以看具体内容!
介绍
正则表达式,大家在开发中应该是经常用到,现在很多开发语言都有正则表达式的应用,比如javascript,java,.net,php等等,我今天就把我对正则表达式的理解跟大家唠唠,不当之处,请多多指教!
定位
我们什么时候使用正则表达式呢?不是所有的字符操作都用正则就好了,php在某些方面用正则反而影响效率。当我们遇到复杂文本数据的解析时候,用正则是比较好的选择。
优点
正则表达式在处理复杂字符操作的时候,可以提高工作效率,也在一定程度节省你的代码量。
缺点
我们在使用正则表达式的时候,复杂的正则表达式会加大代码的复杂度,让人很难理解。所以我们有的时候需要在正则表达式内部添加注释。
通用模式
¤ 定界符,通常使用 "/"做为定界符开始和结束,也可以使用"#"。
什么时候使用"#"呢?一般是在你的字符串中有很多"/"字符的时候,因为正则的时候这种字符需要转义,比如uri。
使用"/"定界符的代码如下.
$regex = '/^http:\/\/([\w.]+)\/([\w]+)\/([\w]+)\.html$/i'; $str = 'http://www.youku.com/show_page/id_ABCDEFG.html'; $matches = array(); if(preg_match($regex, $str, $matches)){ var_dump($matches); } echo "\n";
preg_match中的$matches[0]将包含与整个模式匹配的字符串。
使用"#"定界符的代码如下.这个时候对"/"就不转义!
$regex = '#^http://([\w.]+)/([\w]+)/([\w]+)\.html$#i'; $str = 'http://www.youku.com/show_page/id_ABCDEFG.html'; $matches = array(); if(preg_match($regex, $str, $matches)){ var_dump($matches); } echo "\n";
¤ 修饰符:用于改变正则表达式的行为。
我们看到的('/^http:\/\/([\w.]+)\/([\w]+)\/([\w]+)\.html/i')中的最后一个"i"就是修饰符,表示忽略大小写,还有一个我们经常用到的是"x"表示忽略空格。
贡献代码:
$regex = '/HELLO/'; $str = 'hello word'; $matches = array(); if(preg_match($regex, $str, $matches)){ echo 'No i:Valid Successful!',"\n"; } if(preg_match($regex.'i', $str, $matches)){ echo 'YES i:Valid Successful!',"\n"; }
¤ 字符域:[\w]用方括号扩起来的部分就是字符域。
¤ 限定符:如[\w]{3,5}或者[\w]*或者[\w]+这些[\w]后面的符号都表示限定符。现介绍具体意义。
{3,5}表示3到5个字符。{3,}超过3个字符,{,5}最多5个,{3}三个字符。
* 表示0到多个
+ 表示1到多个。
¤ 脱字符号
^:
> 放在字符域(如:[^\w])中表示否定(不包括的意思)——“反向选择”
> 放在表达式之前,表示以当前这个字符开始。(/^n/i,表示以n开头)。
注意,我们经常管"\"叫"跳脱字符"。用于转义一些特殊符号,如".","/"
通配符(lookarounds):断言某些字符串中某些字符的存在与否!
lookarounds分两种:lookaheads(正向预查 ?=)和lookbehinds(反向预查?<=)。
> 格式:
正向预查:(?=) 相对应的 (?!)表示否定意思
反向预查:(?<=) 相对应的 (?
前后紧跟字符
$regex = '/(?<=c)d(?=e)/'; /* d 前面紧跟c, d 后面紧跟e*/ $str = 'abcdefgk'; $matches = array(); if(preg_match($regex, $str, $matches)){ var_dump($matches); } echo "\n";
否定意义:
$regex = '/(?<!c)d(?!e)/'; /* d 前面不紧跟c, d 后面不紧跟e*/ $str = 'abcdefgk'; $matches = array(); if(preg_match($regex, $str, $matches)){ var_dump($matches); } echo "\n";
>字符宽度:零
验证零字符代码
$regex = '/HE(?=L)LO/i'; $str = 'HELLO'; $matches = array(); if(preg_match($regex, $str, $matches)){ var_dump($matches); } echo "\n";
打印不出结果!
$regex = '/HE(?=L)LLO/i'; $str = 'HELLO'; $matches = array(); if(preg_match($regex, $str, $matches)){ var_dump($matches); } echo "\n";
能打印出结果!
说明:(?=L)意思是HE后面紧跟一个L字符。但是(?=L)本身不占字符,要与(L)区分,(L)本身占一个字符。
捕获数据
没有指明类型而进行的分组,将会被获取,供以后使用。
> 指明类型指的是通配符。所以只有圆括号起始位置没有问号的才能被捕捉。
> 在同一个表达式内的引用叫做反向引用。
> 调用格式: \编号(如\1)。
$regex = '/^(Chuanshanjia)[\w\s!]+\1$/'; $str = 'Chuanshanjia thank Chuanshanjia'; $matches = array(); if(preg_match($regex, $str, $matches)){ var_dump($matches); } echo "\n";
> 避免捕获数据
格式:(?:pattern)
优点:将使有效反向引用数量保持在最小,代码更加、清楚。
>命名捕获组
格式:(?P<组名>) 调用方式 (?P=组名)
$regex = '/(?P<author>chuanshanjia)[\s]Is[\s](?P=author)/i'; $str = 'author:chuanshanjia Is chuanshanjia'; $matches = array(); if(preg_match($regex, $str, $matches)){ var_dump($matches); } echo "\n";
运行结果
惰性匹配(记住:会进行两部操作,请看下面的原理部分)
格式:限定符?
原理:"?":如果前面有限定符,会使用最小的数据。如“*”会取0个,而“+”会取1个,如过是{3,5}会取3个。
先看下面的两个代码:
代码1.
<?php $regex = '/heL*/i'; $str = 'heLLLLLLLLLLLLLLLL'; if(preg_match($regex, $str, $matches)){ var_dump($matches); } echo "\n";
结果1.
代码2
<?php $regex = '/heL*?/i'; $str = 'heLLLLLLLLLLLLLLLL'; if(preg_match($regex, $str, $matches)){ var_dump($matches); } echo "\n";
结果2
代码3,使用“+”
<?php $regex = '/heL+?/i'; $str = 'heLLLLLLLLLLLLLLLL'; if(preg_match($regex, $str, $matches)){ var_dump($matches); } echo "\n";
结果3
代码4,使用{3,5}
<?php $regex = '/heL{3,10}?/i'; $str = 'heLLLLLLLLLLLLLLLL'; if(preg_match($regex, $str, $matches)){ var_dump($matches); } echo "\n";
结果4
正则表达式的注释
格式:(?# 注释内容)
用途:主要用于复杂的注释
贡献代码:是一个用于连接MYSQL数据库的正则表达式
$regex = '/ ^host=(?<!\.)([\d.]+)(?!\.) (?#主机地址) \| ([\w!@#$%^&*()_+\-]+) (?#用户名) \| ([\w!@#$%^&*()_+\-]+) (?#密码) (?!\|)$/ix'; $str = 'host=192.168.10.221|root|123456'; $matches = array(); if(preg_match($regex, $str, $matches)){ var_dump($matches); } echo "\n";
特殊字符
特殊字符 | 解释 |
* | 0到多次 |
+ | 1到多次还可以写成{1,} |
? | 0或1次 |
. | 匹配除换行符外的所有单个的字符 |
\w | [a-zA-Z0-9_] |
\s | 空白字符(空格,换行符,回车符)[\t\n\r] |
\d | [0-9] |
以上所述是小编给大家介绍的PHP正则表达式入门教程的相关知识,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对脚本之家网站的支持!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

IPv6是指InternetProtocolVersion6,是用於網際網路通訊的一種IP位址協定。 IPv6位址是由128個位元位元組成的數字,通常以8個16進位數分組表示。在PHP中,可以使用正規表示式來驗證輸入是否為IPv6位址,以下就介紹如何使用PHP正規表示式來驗證IPv6位址。第一步:了解IPv6位址的格式IPv6位址由8個16進位區塊組成,每個

在PHP中,我們可以使用正規表示式來驗證字串是否為空。字串為空的情況包括以下情況:字串只包含空格。字串長度為0。字串為null或未定義。接下來,我們將介紹如何使用PHP中的正規表示式來驗證這些情況。正規表示式:s+這個正規表示式可以用來匹配只包含空格的字串。其中s表示匹配空格,+表示匹配一個或多個。程式碼範例:functionisEmptySt

身分證號碼和護照號碼是人們生活中常見的證件號碼。在實現涉及這些證件號碼的功能時,經常需要對輸入的號碼進行格式驗證,以確保其正確性。而在PHP中,使用正規表示式可以很好地實現此功能,本文就介紹如何使用PHP正規表示式驗證輸入字串是否為身分證號碼或護照號碼格式。一、身分證號碼驗證身分證號碼是由18位數字和最後一位可能是字母(校驗碼)組成的,其格式如下:前6

在PHP中,正規表示式是常用的字串比對和驗證工具。在開發過程中,需要經常對輸入的檔案路徑進行驗證,確保其格式正確。本文將介紹如何使用正規表示式驗證一個字串是否為檔案路徑。首先,我們需要確定一個檔案路徑的基本格式。在Windows系統中,典型的檔案路徑是類似「C:ProgramFilesPHPphp.exe」這樣的格式。路徑分為以下幾個部分:

在編寫Web應用程式時,經常需要進行電話號碼的驗證。 PHP常用的方法是使用正規表示式來判斷電話號碼的格式是否正確。正規表示式是一個強大的工具,它可以幫助您在簡潔的語句中確定某些模式。以下是在PHP中使用正規表示式來驗證電話號碼格式的範例。首先,讓我們定義電話號碼的通用格式。電話號碼可以包含數字、括號、連字號和空格。一個標準的電話號碼應該包含10個數字,前

隨著網路的快速發展,URL位址已經成為了人們日常生活中不可或缺的一部分。在web開發中,為了確保使用者輸入的URL位址可以正確地被系統識別和使用,我們需要對其進行格式驗證。本文將介紹如何使用PHP正規表示式來驗證URL位址格式。一、URL位址的基本組成部分在了解如何驗證URL位址格式之前,我們首先需要了解URL位址的基本組成部分。通常,一個標準的URL位址由

在開發Web應用程式時,經常需要驗證使用者輸入是否符合特定的格式和長度要求。 PHP正規表示式提供了一個強大的方法來驗證。本文將介紹如何使用PHP正規表示式驗證特定長度的輸入。確定輸入的長度要求在開始編寫正規表示式之前,需要確定輸入的長度要求。例如,如果要求使用者輸入長度為8的密碼,那麼正規表示式應該匹配8個字符,而不是匹配大於等於8個字符的字串。編寫正規則

PHP作為一種流行的伺服器端程式語言,提供了一些強大的工具來驗證輸入資料的正確性。在本篇文章中,我們將重點放在如何使用正規表示式來驗證輸入是否為IPv4位址。首先,什麼是IPv4位址? IPv4位址是指一個32位元二進位數,通常被分成四個8位元二進位數,用"."分隔,表示為十進位形式。例如,127.0.0.1是一個IPv4位址。現在,我們來看看如何使用正規表示式來
