サイトのソースファイルを読んですべてのリンクを取得する
WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB
リリース: 2016-07-25 09:11:10
特定のサイトのソース ファイルを読み取り、正規表現を使用してソース コードを解析し、すべてのリンクを取得します。
- /**********秋水烏編(2002-5-20)*************/
- if(empty($url))$url = "http://www.csdn.net/expert/";//URLを設定
- $site =substr($url,0,strpos($url,"/",8));//サイト
- $base=substr($url,0,strrpos($url,"/") 1);//ファイルディレクトリ
- $fp = fopen($url, "r" );//url
- while(!feof($fp))$contents.=fread($fp,1024);//
- $ pattern="|href=['"]?([^ '"] )['" ]|U";
- preg_match_all($pattern,$contents, $regArr, PREG_SET_ORDER);//すべて一致 href=
- for ( $i=0;$iif(!eregi("://",$regArr[$i][1]))//それがあるかどうかは相対パスです。つまり、://
- if(substr($regArr[$i][1],0,1)=="/")//があるかどうか、サイトのルート ディレクトリであるかどうかです。
- echo "link". ($i 1).":".$site.$regArr[$i][1]."
";//ルートディレクトリ - else
- echo "link". ($i 1). ":".$base.$regArr[$i][1]."
";//現在のディレクトリ
- else
- echo "link".($i 1). ":".$regArr [$i][1]."
";//相対パス
- }
- fclose($fp);
- ?>
コードをコピー
|
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
著者別の最新記事
-
2024-10-22 09:46:29
-
2024-10-13 13:53:41
-
2024-10-12 12:15:51
-
2024-10-11 22:47:31
-
2024-10-11 19:36:51
-
2024-10-11 15:50:41
-
2024-10-11 15:07:41
-
2024-10-11 14:21:21
-
2024-10-11 12:59:11
-
2024-10-11 12:17:31