原則: サイトのソースファイルを読み取り、正規表現を使用してソースコードを分析し、すべてのリンクを取得します
/**********秋水烏編(2002-5-20)*************/
if(empty($url))$url = "http://www.csdn.net/expert/";//URLを設定
$site=substr($url,0,strpos($url,"/",8));//サイト
$base =substr($ url,0,strrpos($url,"/")+1);//ファイルがあるディレクトリ
$fp = fopen($url, "r");//URLを開く
while(!feof($fp) )$contents.=fread($fp,1024);//
$pattern="|href=["]?([^ "]+)[" ]|U" ;
preg_match_all($pattern,$contents , $regArr, PREG_SET_ORDER);// すべて一致 href=
for($i=0;$i
if(substr($regArr[$i] [1],0,1)=="/" )//サイトのルートディレクトリですか? echo "link".($i+1).":".$site.$regArr[$i] [1]."
";// ルートディレクトリ
else
echo "link".($i+1).":".$base.$regArr[$i][1]."
";//現在のディレクトリ
else
echo "link".($i+1).":".$regArr[$i][1]."
"; //相対パス
}
fclose($fp);
? >