首页 > 后端开发 > php教程 > 关于preg_match_all的抓取,该如何解决

关于preg_match_all的抓取,该如何解决

WBOY
发布: 2016-06-13 11:12:47
原创
1044 人浏览过

关于preg_match_all的抓取

<div><br /><h1>标题1</h1><br /><p>内容1</p><br /><p>内容2</p><br /><h1>标题2</h1><br /><p>内容1</p><br /><p>内容2</p><br /><p>内容3</p><br /><p>内容4</p><br /><h1>标题3</h1><br /><p>内容1</p><br /><p>内容2</p><br /><p>内容3</p><br /></div>
登录后复制


我要用preg_match_all()来循环获取从

到下一个

之前的内容即

标题1


内容1


内容2


------------

标题2


内容1


内容2


内容3


内容4


------------

标题3


内容1


内容2


内容3



我想过用
preg_match_all('/<h1>[\w\W]*<(h1|\/div)/U',$html, $out)
登录后复制

但这样抓,会隔一个就跳过,因为第二个的

已经被第一个用了。


------解决方案--------------------
preg_match_all('/<div>(.*)<\/div>/is', $str, $m);<br />$m = explode('<h1>', substr($m[1][0], 5));<br />foreach($m as $x)<br />    echo htmlspecialchars ("<h1>$x") . '<br/>';
登录后复制

相关标签:
来源:php.cn
本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板