サイトのソースファイルを読んですべてのリンクを取得する
WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB
リリース: 2016-07-25 09:11:10
特定のサイトのソース ファイルを読み取り、正規表現を使用してソース コードを解析し、すべてのリンクを取得します。
- /**********秋水烏編(2002-5-20)*************/
- if(empty($url))$url = "http://www.csdn.net/expert/";//URLを設定
- $site =substr($url,0,strpos($url,"/",8));//サイト
- $base=substr($url,0,strrpos($url,"/") 1);//ファイルディレクトリ
- $fp = fopen($url, "r" );//url
- while(!feof($fp))$contents.=fread($fp,1024);//
- $ pattern="|href=['"]?([^ '"] )['" ]|U";
- preg_match_all($pattern,$contents, $regArr, PREG_SET_ORDER);//すべて一致 href=
- for ( $i=0;$iif(!eregi("://",$regArr[$i][1]))//それがあるかどうかは相対パスです。つまり、://
- if(substr($regArr[$i][1],0,1)=="/")//があるかどうか、サイトのルート ディレクトリであるかどうかです。
- echo "link". ($i 1).":".$site.$regArr[$i][1]."
";//ルートディレクトリ - else
- echo "link". ($i 1). ":".$base.$regArr[$i][1]."
";//現在のディレクトリ
- else
- echo "link".($i 1). ":".$regArr [$i][1]."
";//相対パス
- }
- fclose($fp);
- ?>
コードをコピー
|
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
著者別の最新記事
-
2025-02-26 03:58:14
-
2025-02-26 03:38:10
-
2025-02-26 03:17:10
-
2025-02-26 02:49:09
-
2025-02-26 01:08:13
-
2025-02-26 00:46:10
-
2025-02-25 23:42:08
-
2025-02-25 22:50:13
-
2025-02-25 21:54:11
-
2025-02-25 20:45:11