首頁 > 後端開發 > php教程 > PHP取得指定URL頁面中的所有鏈接

PHP取得指定URL頁面中的所有鏈接

WBOY
發布: 2016-08-08 09:25:58
原創
955 人瀏覽過

form:http://www.uphtm.com/php/253.html

這個東西其實我們開發人員來講常用了,以前做一個抓取其它網站友情連接時用過,今天看到一朋友整理了一個PHP獲取指定URL頁面中的所有鏈接函數,整理過來我們一起來看看吧。

以下程式碼可以取得到指定URL頁面中的所有鏈接,即所有a標籤的href屬性:

  1. // 取得連結的HTML程式碼
  2. $html = file_get_contents('http://www.111cn.net');
  3. $dom = new DOMDocument();
  4. @$dom->loadHTML($html);
  5. $xpath = new DOMXPath($dom);
  6. $hrefs = $xpath->evaluate('/html/body//a');
  7. for ($i = 0; $i length; $i++) {
  8.    $href = $hrefs->item($i);
  9.    $url = $href->getAttribute('href');
  10.    echo $url.'
    ';
  11. }

這段程式碼會取得到所有a標籤的href屬性,但是href屬性值不一定是鏈接,我們可以在做個過濾,只保留http開頭的連結位址:

  1. // 取得連結的HTML程式碼
  2. $html = file_get_contents('http://www.111cn.net');
  3. $dom = new DOMDocument();
  4. @$dom->loadHTML($html);
  5. $xpath = new DOMXPath($dom);
  6. $hrefs = $xpath->evaluate('/html/body//a');
  7. for ($i = 0; $i length; $i++) {
  8.    $href = $hrefs->item($i);
  9.    $url = $href->getAttribute('href');
  10.   
  11.    // 保留以http開頭的連結
  12.    if(substr($url, 0, 4) == 'http')
  13.       echo $url.'
    ';
  14. }

fopen()函數讀取指定網頁中的所有連結並統計出數量,在一些需要擷取網頁頁容的地方,適合使用本程式碼,本例以讀取百度首頁為例,找出百度首頁中所有的連結地址,程式碼經過測試,完全可用:

  1. if(empty($url))$url = "http://www.baidu.com/";//需要採集連結的URL位址
  2. $site=substr($url,0,strpos($url,"/",8));
  3. $base=substr($url,0,strrpos($url,"/")+1);//檔案所在目錄
  4. $fp = fopen($url, "r" );//開啟url位址頁面
  5. while(!feof($fp))$contents.=fread($fp,1024);
  6. $pattern="|href=['"]?([^ '"]+)['" ]|U";
  7. preg_match_all($pattern,$contents, $regArr, PREG_SET_ORDER);//使用正規符合所有href=
  8. for($i=0;$i
  9. if(!eregi("://",$regArr[$i][1]))//判斷是否為相對路徑,即是否還有://
  10.     if(substr($regArr[$i][1],0,1)=="/")//是否為站點的根目錄
  11.     echo "link".($i+1).":".$site.$regArr[$i][1]."
    ";//根目錄
  12.     else
  13.     echo "link".($i+1).":".$base.$regArr[$i][1]."
    ";//目前目錄
  14. else
  15.     echo "link".($i+1).":".$regArr[$i][1]."
    ";//相對路徑
  16. }
  17. fclose($fp);
  18. ?>

form:http://www.uphtm.com/php/253.html

以上就介紹了PHP獲取指定URL頁面中的所有鏈接,包括了方面的內容,希望對PHP教程有興趣的朋友有所幫助。

相關標籤:
來源:php.cn
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板