假如有一段文本,你只想匹配最短的可能,而不是最长。本文就主要给大家介绍了关于正则表达式中最短匹配模式用法的相关资料。
前言
最近有一次想用正则表达式从网页里面抓取一些东西出来,内容不复杂却出现不少问题。下面话不多说,来一起看看详细的介绍:
当我们用正则表达式去匹配一个标签的首尾的时候,比如匹配 <h1>hello world</h1>
中的 h1 的开始和闭合标签
可能很多人会这样写
/<.*h1>/g
但是这样真的可以吗?
因为 * 匹配符是匹配前面一个字符的零到多个,而且它是贪婪匹配的
所以你得到的就会是下面的结果了。
显然这并不是我们想要的,那么怎么把贪婪匹配换成最小匹配呢,
/<.*?h1>/g
上面的写法就可以了,如下图:
其实原理应该很简单,因为 ? 也是贪婪匹配,并且只能匹配0到1个,
所以它会匹配到第一个的时候就结束了,从而阻止了 * 的匹配多个的贪婪。
以上内容就是正则表达式中最短匹配模式的用法,希望能帮助到大家。
相关推荐:
以上是正则表达式中最短匹配模式的用法的详细内容。更多信息请关注PHP中文网其他相关文章!