关于preg_match_all的抓取
<div><br /><h1>标题1</h1><br /><p>内容1</p><br /><p>内容2</p><br /><h1>标题2</h1><br /><p>内容1</p><br /><p>内容2</p><br /><p>内容3</p><br /><p>内容4</p><br /><h1>标题3</h1><br /><p>内容1</p><br /><p>内容2</p><br /><p>内容3</p><br /></div>
内容1
内容2
内容1
内容2
内容3
内容4
内容1
内容2
内容3
preg_match_all('/<h1>[\w\W]*<(h1|\/div)/U',$html, $out)
preg_match_all('/<div>(.*)<\/div>/is', $str, $m);<br />$m = explode('<h1>', substr($m[1][0], 5));<br />foreach($m as $x)<br /> echo htmlspecialchars ("<h1>$x") . '<br/>';