サイトのソースファイルを読んですべてのリンクを取得する

WBOY
リリース: 2016-07-25 09:11:10
オリジナル
805 人が閲覧しました
特定のサイトのソース ファイルを読み取り、正規表現を使用してソース コードを解析し、すべてのリンクを取得します。
  1. /**********秋水烏編(2002-5-20)*************/
  2. if(empty($url))$url = "http://www.csdn.net/expert/";//URLを設定
  3. $site =substr($url,0,strpos($url,"/",8));//サイト
  4. $base=substr($url,0,strrpos($url,"/") 1);//ファイルディレクトリ
  5. $fp = fopen($url, "r" );//url
  6. while(!feof($fp))$contents.=fread($fp,1024);//
  7. $ pattern="|href=['"]?([^ '"] )['" ]|U";
  8. preg_match_all($pattern,$contents, $regArr, PREG_SET_ORDER);//すべて一致 href=
  9. for ( $i=0;$iif(!eregi("://",$regArr[$i][1]))//それがあるかどうかは相対パスです。つまり、://
  10. if(substr($regArr[$i][1],0,1)=="/")//があるかどうか、サイトのルート ディレクトリであるかどうかです。
  11. echo "link". ($i 1).":".$site.$regArr[$i][1]."
    ";//ルートディレクトリ
  12. else
  13. echo "link". ($i 1). ":".$base.$regArr[$i][1]."
    ";//現在のディレクトリ
  14. else
  15. echo "link".($i 1). ":".$regArr [$i][1]."
    ";//相対パス
  16. }
  17. fclose($fp);
  18. ?>
コードをコピー


ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート