如何使用正则来查找lookaround
这次给大家带来如何使用正则来查找lookaround,使用正则来查找lookaround的注意事项有哪些,下面就是实战案例,一起来看一下。
本文实例讲述了正则表达式教程之前后查找lookaround。分享给大家供大家参考,具体如下:
注:在所有例子中正则表达式匹配结果包含在源文本中的【和】之间,有的例子会使用Java来实现,如果是java本身正则表达式的用法,会在相应的地方说明。所有java例子都在JDK1.6.0_13下测试通过。
一、问题引入
在HTML页面中,匹配出一对标签之间的文本,如匹配出页面的标签,即
文本:
正则表达式:<[Tt][Ii][Tt][Ll][Ee]>.*? [Tt][Ii][Tt][Ll][Ee]>
结果:【
分析:<[Tt][Ii][Tt][Ll][Ee]>表示不区分大小写,这个模式匹配到了title标签以及它们之间的文本,但是并不完美,因为我们只想要title标签之间的文本,而不包括标签本身。解决这个问题我们就需要用到前后查找(lookaround)。
二、向前查找
向前查找指定了一个必须匹配但不在结果中返回的模式。向前查找实际上就是一个子表达式,它以?=开头,需要匹配的文本跟在=的后面。
看一个匹配出一个URL地址中协议部分的例子:
文本:http://blog.csdn.net/mhmyqn
正则表达式:.+(?=:)
结果:【http】://blog.csdn.net/mhmyqn
分析:URL地址中协议部分是在:之前的部分,模式.+匹配任意文本,子表达式(?=:)匹配:,但是被匹配到的:并没有出现在结果中。我们使用?=向正则表达式引擎表明,只要找到:就行了,但不包括在最终的返回结果里。这里如果不使用向前匹配(?=:),而是直接使用(:),那么匹配结果就会是http:了,它包括了:,并不是我们想要的。
注意:前后查找中的前、后是指模式与被查找文本的相对位置而言的,左为前,右为后。即向前查找为:xxx(?=xxx),而向后查找为(?<=xxx)xxx,向后查找在接下来会介绍到。
三、向后查找
向后查找操作符是?<=。但是并不是所有的正则表达式实现都支持向后查找,JavaScript就不支持,java语言支持向后查找。
比如要查找文本当中的价格(以$开头,后面跟数字),结果不包含货币符号:
文本:category1:$136.25,category2:$28,category3:$88.60
正则表达式:(?<=\$)\d+(\.\d+)?
结果:category1:$【136.25】,category2:$【28】,category3:$【88.60】
分析:(?<=\$)模式匹配$,\d+(\.\d+)?模式匹配整数或小数。从结果可以看出,结果不没有包括货币符号,只匹配出了价格。如果不使用向后查找,情况会是什么样呢?使用模式$\d+(\.\d+)?,这样会把$包含在结果中。使用模式\d+(\.\d+)?,又会把categery1(23)中的数字也匹配出来,都不是我们想要的。
注意:向前查找模式的长度是可变的,它们可以包含.、*、+之类的元字符;而向后查找模式只能是固定长度,不能包含.、*、+之类的元字符。
四、把向前查找和向后查找结合起来
把向前查找和向后查找结合起来使用,即可解决前面HTML标签之间的文本的问题:
文本:
正则表达式:(?<=<[Tt][Ii][Tt][Ll][Ee]>).*?(?= [Tt][Ii][Tt][Ll][Ee]>)
结果:
分析:从结果可以看出,问题完美的解决了。(?<=<[Tt][Ii][Tt][Ll][Ee]>)是一个向后操作,它匹配
五、对前后查找取非
前面说到的向前查找和向后查找通常都是用来匹配文本,其目的是为了确定将被返回的匹配结果的文本的位置(通过指定匹配结果的前后必须是哪些文本)。这种用法叫正向前查找和正向后查找。还有一种负向前查找和负向后查找,是查找那些不与给定模式相匹配的文本。
前后查找的操作符:
(?=) | 正向前查找 |
(?!) | 负向前查找 |
(?<=) | 正向后查找 |
(? | 负向后查找 |
比如一段文本中即有价格(以$开头,后面跟数字)和数量,我们要找出价格和数量,先来看查找价格:
文本:I paid $30 for 10 apples, 15 oranges, and 10 pears. I saved $5 onthis order.
正则表达式:(?<=\$)\d+
结果:I paid 【$30】 for 10 apples, 15 oranges, and 10 pears. I saved 【$5】 on thisorder.
查找数量:
文本:I paid $30 for 10 apples, 15 oranges, and 10 pears. I saved $5 onthis order.
正则表达式:\b(?
结果:I paid $30 for 【10】 apples, 【15】 oranges, and 【10】pears. I saved $5 on this order.
相信看了本文案例你已经掌握了方法,更多精彩请关注php中文网其它相关文章!
推荐阅读:
Atas ialah kandungan terperinci 如何使用正则来查找lookaround. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas



Apa yang berlaku apabila anda mematikan Cari Saya pada iPhone? Cari iPhone Saya membantu anda mencari peranti yang hilang atau dicuri. Apabila didayakan, Cari iPhone Saya membolehkan anda menjejak lokasi peranti anda pada peta, memainkan bunyi dan membantu anda mencari peranti anda. Cari Saya juga termasuk Kunci Pengaktifan untuk menghalang sesiapa daripada menggunakan iPhone anda. Apabila anda mematikan Cari iPhone Saya, anda kehilangan semua ciri ini, yang mungkin menyukarkan untuk memulihkan peranti Apple yang hilang. Walaupun Cari iPhone Saya sangat berguna, anda harus melumpuhkannya apabila anda ingin menjual, menderma, menukar telefon anda atau menghantarnya untuk penggantian bateri atau sebarang perkhidmatan lain. Melakukan ini akan memastikan tiada sesiapa boleh mengakses maklumat tentang anda

Apl Cari Saya Apple membolehkan anda mencari iPhone anda atau peranti lain untuk mengelakkannya daripada hilang atau dilupakan. Walaupun Cari Saya ialah alat yang berguna untuk menjejak peranti, anda mungkin mahu melumpuhkannya jika anda bimbang tentang isu privasi, tidak mahu menghabiskan bateri anda atau atas sebab lain. Nasib baik, terdapat beberapa cara untuk mematikan Cari Saya pada iPhone, semuanya akan kami terangkan dalam artikel ini. Cara Mematikan Cari Saya pada iPhone [4 Kaedah] Anda boleh mematikan Cari Saya pada iPhone dalam empat cara. Jika anda menggunakan Kaedah 1 untuk mematikan Cari, anda boleh melakukan ini daripada peranti yang anda mahu nyahdayakannya. Untuk meneruskan kaedah 2, 3 dan 4, iPhone yang anda ingin matikan Finder harus dimatikan atau

Gunakan fungsi Array.IndexOf dalam C# untuk mencari indeks elemen dalam tatasusunan Dalam program C#, apabila kita perlu mencari indeks elemen dalam tatasusunan, kita boleh menggunakan fungsi Array.IndexOf. Fungsi Array.IndexOf mencari elemen yang ditentukan dalam julat tatasusunan yang ditentukan dan mengembalikan indeks kejadian pertamanya. Jika elemen tidak dijumpai, -1 dikembalikan. Berikut ialah kod sampel yang menunjukkan cara menggunakan fungsi Array.IndexOf untuk mencari elemen dalam tatasusunan.

Nombor siri cakera keras dan alamat MAC adalah pengecam penting dalam perkakasan komputer dan sangat berguna dalam mengurus dan menyelenggara sistem komputer. Artikel ini akan memperkenalkan cara mencari nombor siri cakera keras dan alamat MAC. 1. Cari nombor siri cakera keras Nombor siri cakera keras ialah pengecam unik yang digunakan oleh pengeluar cakera keras untuk mengenal pasti dan menjejaki cakera keras. Dalam sistem pengendalian yang berbeza, kaedah mencari nombor siri cakera keras adalah sedikit berbeza. Windows: Buka Prompt Perintah (cari "cmd" dalam menu Mula) dan masukkan arahan berikut dan tekan Enter: wmicdisk

Fungsi glob() dalam PHP digunakan untuk mencari fail atau direktori dan merupakan fungsi operasi fail yang berkuasa. Ia boleh mengembalikan laluan fail atau direktori berdasarkan padanan corak yang ditentukan. Sintaks fungsi glob() adalah seperti berikut: glob(corak, bendera) dengan corak mewakili rentetan corak yang akan dipadankan, yang boleh menjadi ungkapan kad bebas, seperti *.txt (fail yang sepadan berakhir dengan .txt), atau laluan Fail tertentu. flags ialah parameter pilihan yang digunakan untuk mengawal fungsi

Ungkapan biasa PHP ialah alat yang berkuasa untuk pemprosesan dan penukaran teks. Ia boleh mengurus maklumat teks dengan berkesan dengan menghuraikan kandungan teks dan menggantikan atau memintasnya mengikut corak tertentu. Antaranya, aplikasi biasa ungkapan biasa adalah untuk menggantikan rentetan bermula dengan aksara tertentu Kami akan menerangkannya seperti berikut

Ungkapan biasa Golang menggunakan aksara paip | untuk memadankan berbilang perkataan atau rentetan, memisahkan setiap pilihan sebagai ungkapan OR logik. Contohnya: padanan "musang" atau "anjing": musang|padanan anjing "cepat", "coklat" atau "malas": (cepat|coklat|malas) sepadan dengan "Pergi", "Python" atau "Java": Pergi| Python |Java memadankan perkataan atau kod zip 4 digit: ([a-zA

Dalam masalah ini, kita diberi tatasusunan aar[] yang mengandungi n nilai integer tidak diisih dan val integer. Tugas kita adalah untuk mencari indeks permulaan dan akhir sesuatu elemen dalam tatasusunan yang tidak diisih. Untuk kejadian elemen dalam tatasusunan, kami akan kembali, "indeks permulaan dan indeks akhir" (jika ditemui dua kali atau lebih dalam tatasusunan). "Indeks tunggal" (jika ditemui) "Elemen tidak wujud" jika tidak terdapat dalam tatasusunan. Mari kita ambil contoh untuk memahami masalah, Contoh 1Input:arr[]={2,1,5,4,6,2,3},val=2Output:startingindex=0,endingindex=5 menerangkan bahawa elemen 2 muncul dua kali , Kali pertama muncul pada indeks = 0, yang kedua
