> 백엔드 개발 > PHP 튜토리얼 > 关于preg_match_all的抓取,该如何解决

关于preg_match_all的抓取,该如何解决

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB
풀어 주다: 2016-06-13 11:12:47
원래의
1054명이 탐색했습니다.

关于preg_match_all的抓取

<div><br /><h1>标题1</h1><br /><p>内容1</p><br /><p>内容2</p><br /><h1>标题2</h1><br /><p>内容1</p><br /><p>内容2</p><br /><p>内容3</p><br /><p>内容4</p><br /><h1>标题3</h1><br /><p>内容1</p><br /><p>内容2</p><br /><p>内容3</p><br /></div>
로그인 후 복사


我要用preg_match_all()来循环获取从

到下一个

之前的内容即

标题1


内容1


内容2


------------

标题2


内容1


内容2


内容3


内容4


------------

标题3


内容1


内容2


内容3



我想过用
preg_match_all('/<h1>[\w\W]*<(h1|\/div)/U',$html, $out)
로그인 후 복사

但这样抓,会隔一个就跳过,因为第二个的

已经被第一个用了。


------解决方案--------------------
preg_match_all('/<div>(.*)<\/div>/is', $str, $m);<br />$m = explode('<h1>', substr($m[1][0], 5));<br />foreach($m as $x)<br />    echo htmlspecialchars ("<h1>$x") . '<br/>';
로그인 후 복사

관련 라벨:
원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿