正则匹配的贪婪原则

WBOY
リリース: 2016-06-06 20:19:39
オリジナル
1716 人が閲覧しました

问题:写了一个正则匹配,为什么每次只匹配一个中文,我写的是+,按照贪婪原则应该尽可能多的匹配。

<code>// $str 是个抓取到的html ,根据规则获取中文
$str = '...<span class="employment item" title="匹配中文字符">匹配中文字符</span>...';
preg_match('/<span.>/u', $str, $match);

var_dump($match[1]);

// 想要结果:匹配中文字符
// 输出结果: 字   </span.></code>
ログイン後にコピー
ログイン後にコピー

求大神指点


大神指点迷津之后:
做了修改,如下即可,尽可能的让前面的贪婪到固定的结束为止。 done

<code>// $str 是个抓取到的html ,根据规则获取中文
$str = '...<span class="employment item" title="匹配中文字符">匹配中文字符</span>...';
preg_match('/<span.>/u', $str, $match);

var_dump($match[1]);

// 想要结果:匹配中文字符
// 输出结果: 匹配中文字符   </span.></code>
ログイン後にコピー
ログイン後にコピー

回复内容:

问题:写了一个正则匹配,为什么每次只匹配一个中文,我写的是+,按照贪婪原则应该尽可能多的匹配。

<code>// $str 是个抓取到的html ,根据规则获取中文
$str = '...<span class="employment item" title="匹配中文字符">匹配中文字符</span>...';
preg_match('/<span.>/u', $str, $match);

var_dump($match[1]);

// 想要结果:匹配中文字符
// 输出结果: 字   </span.></code>
ログイン後にコピー
ログイン後にコピー

求大神指点


大神指点迷津之后:
做了修改,如下即可,尽可能的让前面的贪婪到固定的结束为止。 done

<code>// $str 是个抓取到的html ,根据规则获取中文
$str = '...<span class="employment item" title="匹配中文字符">匹配中文字符</span>...';
preg_match('/<span.>/u', $str, $match);

var_dump($match[1]);

// 想要结果:匹配中文字符
// 输出结果: 匹配中文字符   </span.></code>
ログイン後にコピー
ログイン後にコピー

因为前面的.+先贪婪了,它贪完了才轮到你想要的匹配组。而且后面还有个.+,所以你的匹配组还要给它留一个字。
结果就是前面贪婪匹配了一堆,后面匹配最后一个汉字。留给你的匹配组的就是倒数第二个汉字了。

関連ラベル:
ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
最新の問題
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート