> 백엔드 개발 > PHP 튜토리얼 > 求助,关于php采集url地址

求助,关于php采集url地址

WBOY
풀어 주다: 2016-06-23 14:11:56
원래의
982명이 탐색했습니다.

我想在如下网页采集所有的帖子url地址

http://www.discuz.net/forum-10-1.html
로그인 후 복사


帖子格式为
http://www.discuz.net/thread-3265731-1-1.html
로그인 후 복사


只要url链接,得出的结果一行一个


回复讨论(解决方案)

$url = 'http://www.discuz.net/forum-10-1.html';$ch = curl_init();curl_setopt($ch, CURLOPT_URL,$url);curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.9.2) Gecko/20100115 Firefox/3.6 (.NET CLR 3.5.30729)');$htmls = curl_exec($ch);curl_close($ch);$doc = new DOMDocument();libxml_use_internal_errors(true);$doc->loadHTML($htmls);$xpath = new DOMXPath($doc);$nodeList = $xpath->query('//a/@href');for ($i = 0; $i < $nodeList->length; $i++) {	if(preg_match('@\/thread\-@',$nodeList->item($i)->value,$match)){		echo $nodeList->item($i)->value. "<br/>";	}}
로그인 후 복사

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿