首頁 後端開發 php教程 PHP取得指定URL頁面中的所有鏈接

PHP取得指定URL頁面中的所有鏈接

Aug 08, 2016 am 09:25 AM
href html nbsp url

form:http://www.uphtm.com/php/253.html

這個東西其實我們開發人員來講常用了,以前做一個抓取其它網站友情連接時用過,今天看到一朋友整理了一個PHP獲取指定URL頁面中的所有鏈接函數,整理過來我們一起來看看吧。

以下程式碼可以取得到指定URL頁面中的所有鏈接,即所有a標籤的href屬性:

  1. // 取得連結的HTML程式碼
  2. $html = file_get_contents('http://www.111cn.net');
  3. $dom = new DOMDocument();
  4. @$dom->loadHTML($html);
  5. $xpath = new DOMXPath($dom);
  6. $hrefs = $xpath->evaluate('/html/body//a');
  7. for ($i = 0; $i length; $i++) {
  8.    $href = $hrefs->item($i);
  9.    $url = $href->getAttribute('href');
  10.    echo $url.'
    ';
  11. }

這段程式碼會取得到所有a標籤的href屬性,但是href屬性值不一定是鏈接,我們可以在做個過濾,只保留http開頭的連結位址:

  1. // 取得連結的HTML程式碼
  2. $html = file_get_contents('http://www.111cn.net');
  3. $dom = new DOMDocument();
  4. @$dom->loadHTML($html);
  5. $xpath = new DOMXPath($dom);
  6. $hrefs = $xpath->evaluate('/html/body//a');
  7. for ($i = 0; $i length; $i++) {
  8.    $href = $hrefs->item($i);
  9.    $url = $href->getAttribute('href');
  10.   
  11.    // 保留以http開頭的連結
  12.    if(substr($url, 0, 4) == 'http')
  13.       echo $url.'
    ';
  14. }

fopen()函數讀取指定網頁中的所有連結並統計出數量,在一些需要擷取網頁頁容的地方,適合使用本程式碼,本例以讀取百度首頁為例,找出百度首頁中所有的連結地址,程式碼經過測試,完全可用:

  1. if(empty($url))$url = "http://www.baidu.com/";//需要採集連結的URL位址
  2. $site=substr($url,0,strpos($url,"/",8));
  3. $base=substr($url,0,strrpos($url,"/")+1);//檔案所在目錄
  4. $fp = fopen($url, "r" );//開啟url位址頁面
  5. while(!feof($fp))$contents.=fread($fp,1024);
  6. $pattern="|href=['"]?([^ '"]+)['" ]|U";
  7. preg_match_all($pattern,$contents, $regArr, PREG_SET_ORDER);//使用正規符合所有href=
  8. for($i=0;$i
  9. if(!eregi("://",$regArr[$i][1]))//判斷是否為相對路徑,即是否還有://
  10.     if(substr($regArr[$i][1],0,1)=="/")//是否為站點的根目錄
  11.     echo "link".($i+1).":".$site.$regArr[$i][1]."
    ";//根目錄
  12.     else
  13.     echo "link".($i+1).":".$base.$regArr[$i][1]."
    ";//目前目錄
  14. else
  15.     echo "link".($i+1).":".$regArr[$i][1]."
    ";//相對路徑
  16. }
  17. fclose($fp);
  18. ?>

form:http://www.uphtm.com/php/253.html

以上就介紹了PHP獲取指定URL頁面中的所有鏈接,包括了方面的內容,希望對PHP教程有興趣的朋友有所幫助。

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

HTML 中的表格邊框 HTML 中的表格邊框 Sep 04, 2024 pm 04:49 PM

HTML 表格邊框指南。在這裡,我們以 HTML 中的表格邊框為例,討論定義表格邊框的多種方法。

HTML 中的巢狀表 HTML 中的巢狀表 Sep 04, 2024 pm 04:49 PM

這是 HTML 中巢狀表的指南。這裡我們討論如何在表中建立表格以及對應的範例。

HTML 左邊距 HTML 左邊距 Sep 04, 2024 pm 04:48 PM

HTML 左邊距指南。在這裡,我們討論 HTML margin-left 的簡要概述及其範例及其程式碼實作。

HTML 表格佈局 HTML 表格佈局 Sep 04, 2024 pm 04:54 PM

HTML 表格佈局指南。在這裡,我們詳細討論 HTML 表格佈局的值以及範例和輸出。

HTML 輸入佔位符 HTML 輸入佔位符 Sep 04, 2024 pm 04:54 PM

HTML 輸入佔位符指南。在這裡,我們討論 HTML 輸入佔位符的範例以及程式碼和輸出。

HTML 有序列表 HTML 有序列表 Sep 04, 2024 pm 04:43 PM

HTML 有序列表指南。在這裡我們也分別討論了 HTML 有序列表和類型的介紹以及它們的範例

在 HTML 中移動文字 在 HTML 中移動文字 Sep 04, 2024 pm 04:45 PM

HTML 中的文字移動指南。在這裡我們討論一下marquee標籤如何使用語法和實作範例。

HTML onclick 按鈕 HTML onclick 按鈕 Sep 04, 2024 pm 04:49 PM

HTML onclick 按鈕指南。這裡我們分別討論它們的介紹、工作原理、範例以及各個事件中的onclick事件。

See all articles