正規表示式教學之前後再查找lookaround詳解
本文實例講述了正規表示式教學之前後查找lookaround。分享給大家供大家參考,具體如下:
注:在所有例子中正則表達式匹配結果包含在源文本中的【和】之間,有的例子會使用Java來實現,如果是java本身正則表達式的用法,會在對應的地方說明。所有java例子都在JDK1.6.0_13下測試通過。
一、問題引入
在HTML頁面中,匹配一對標籤之間的文本,如匹配出頁面的標籤,即
文本:
正規表示式:.*? [Tt][Ii] [Tt][Ll][Ee]>
結果:
【分析:表示不區分大小寫,這個模式匹配到了title標籤以及它們之間的文本,但是並不完美,因為我們只想要title標籤之間的文本,而不包括標籤本身。解決這個問題我們就需要用到前後查找(lookaround)。
二、向前查找
向前查找指定了一個必須匹配但不在結果中返回的模式。向前查找其實就是一個子表達式,它以?=開頭,需要匹配的文字跟在=的後面。
看一個符合出一個URL位址中協定部分的範例:
文字:http://blog.csdn.net/mhmyqn
正規表示式:.+(?=:)
結果:【http】 ://blog.csdn.net/mhmyqn
分析:URL位址中協議部分是在:之前的部分,模式.+匹配任意文本,子表達式(?=:)匹配:,但是被匹配到的:並沒有出現在結果中。我們使用?=向正規表示式引擎表明,只要找到:就行了,但不包括在最終的返回結果裡。這裡如果不使用向前匹配(?=:),而是直接使用(:),那麼匹配結果就會是http:了,它包括了:,並不是我們想要的。
注意:前後查找中的前、後是指模式與被查找文本的相對位置而言的,左為前,右為後。即向前查找為:xxx(?=xxx),而向後查找為(?
三、向後查找
向後查找操作符是?
例如要找出文本當中的價格(以$開頭,後面跟數字),結果不包含貨幣符號:
文本:category1:$136.25,category2:$28,category3:$88.60
正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式: $)d+(.d+)?
結果:category1:$【136.25】,category2:$【28】,category3:$【88.60】
分析:(?
注意:向前查找模式的長度是可變的,它們可以包含.、*、+之類的元字符;而向後查找模式只能是固定長度,不能包含.、*、+之類的元字元。
四、把向前查找和向後查找結合起來
把向前查找和向後查找結合起來使用,即可解決前面HTML標籤之間的文本的問題:
文本:
正規表示式:(?).*?(?= [ Tt][Ii][Tt][Ll][Ee]>)
結果:
分析:從結果可以看出,問題完美的解決了。 (?)是向後操作,它符合
五、對前後查找取非
前面說到的向前查找和向後查找通常都是用來匹配文本,其目的是為了確定將被返回的匹配結果的文本的位置(通過指定匹配結果的前後必須是哪些文本)。這種用法叫正向前查找和正向後查找。還有一種負向前查找和負向後查找,是查找那些不與給定模式相符的文字。
前後查找的操作符:
例如一段文字中即有價格(以$開頭,後面跟數字)和數量,我們要找出價格和數量,先來看查找價格:
文本:I paid $30 for 10 apples, 15 oranges, and 10 pears. I saved $5 onthis order.
正則表達式:(?
結果:I paid 【$30】 for 10 apples, 15 oranges, and 10 pears. I saved
查找數量:文本:I paid $30 for 10 apples, 15 oranges, and 10 pears. I saved $5 onthis order.正則表達式:b(? pI$30 for 【10】 apples, 【15】 oranges, and 【10】pears. I saved $5 on this order.
分析:(?
六、小結
有了前後查找,就可以對最終的匹配結果包含哪些內容做出精確的控制。前後查找操作使我們可以利用子表達式來指定文字匹配操作發生的位置,並收到只匹配不消費的效果。
希望本文所述對大家正規表示式學習有所幫助。
更多正規表示式教學之前後查找lookaround詳解相關文章請關注PHP中文網!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

JWT是一種基於JSON的開放標準,用於在各方之間安全地傳輸信息,主要用於身份驗證和信息交換。 1.JWT由Header、Payload和Signature三部分組成。 2.JWT的工作原理包括生成JWT、驗證JWT和解析Payload三個步驟。 3.在PHP中使用JWT進行身份驗證時,可以生成和驗證JWT,並在高級用法中包含用戶角色和權限信息。 4.常見錯誤包括簽名驗證失敗、令牌過期和Payload過大,調試技巧包括使用調試工具和日誌記錄。 5.性能優化和最佳實踐包括使用合適的簽名算法、合理設置有效期、

會話劫持可以通過以下步驟實現:1.獲取會話ID,2.使用會話ID,3.保持會話活躍。在PHP中防範會話劫持的方法包括:1.使用session_regenerate_id()函數重新生成會話ID,2.通過數據庫存儲會話數據,3.確保所有會話數據通過HTTPS傳輸。

PHP8.1中的枚舉功能通過定義命名常量增強了代碼的清晰度和類型安全性。 1)枚舉可以是整數、字符串或對象,提高了代碼可讀性和類型安全性。 2)枚舉基於類,支持面向對象特性,如遍歷和反射。 3)枚舉可用於比較和賦值,確保類型安全。 4)枚舉支持添加方法,實現複雜邏輯。 5)嚴格類型檢查和錯誤處理可避免常見錯誤。 6)枚舉減少魔法值,提升可維護性,但需注意性能優化。

SOLID原則在PHP開發中的應用包括:1.單一職責原則(SRP):每個類只負責一個功能。 2.開閉原則(OCP):通過擴展而非修改實現變化。 3.里氏替換原則(LSP):子類可替換基類而不影響程序正確性。 4.接口隔離原則(ISP):使用細粒度接口避免依賴不使用的方法。 5.依賴倒置原則(DIP):高低層次模塊都依賴於抽象,通過依賴注入實現。

在PHPStorm中如何進行CLI模式的調試?在使用PHPStorm進行開發時,有時我們需要在命令行界面(CLI)模式下調試PHP�...

使用PHP的cURL庫發送JSON數據在PHP開發中,經常需要與外部API進行交互,其中一種常見的方式是使用cURL庫發送POST�...

靜態綁定(static::)在PHP中實現晚期靜態綁定(LSB),允許在靜態上下文中引用調用類而非定義類。 1)解析過程在運行時進行,2)在繼承關係中向上查找調用類,3)可能帶來性能開銷。
