ホームページ > バックエンド開発 > PHPチュートリアル > PHP_PHPチュートリアルで特定のサイトのリンク関数を読み取る方法

PHP_PHPチュートリアルで特定のサイトのリンク関数を読み取る方法

WBOY
リリース: 2016-07-13 17:32:06
オリジナル
795 人が閲覧しました


原則: サイトのソースファイルを読み取り、正規表現を使用してソースコードを分析し、すべてのリンクを取得します
/**********秋水烏編(2002-5-20)*************/
if(empty($url))$url = "http://www.csdn.net/expert/";//URLを設定
$site=substr($url,0,strpos($url,"/",8));//サイト
$base =substr($ url,0,strrpos($url,"/")+1);//ファイルがあるディレクトリ

$fp = fopen($url, "r");//URLを開く
while(!feof($fp) )$contents.=fread($fp,1024);//

$pattern="|href=["]?([^ "]+)[" ]|U" ;
preg_match_all($pattern,$contents , $regArr, PREG_SET_ORDER);// すべて一致 href=
for($i=0;$i if (!eregi("://" ,$regArr[$i][1]))//相対パスかどうか、つまり://
if(substr($regArr[$i] [1],0,1)=="/" )//サイトのルートディレクトリですか? echo "link".($i+1).":".$site.$regArr[$i] [1]."
";// ルートディレクトリ
else
echo "link".($i+1).":".$base.$regArr[$i][1]."
";//現在のディレクトリ
else
echo "link".($i+1).":".$regArr[$i][1]."
"; //相対パス
}
fclose($fp);
? >

http://www.bkjia.com/PHPjc/508875.html

www.bkjia.comtru​​ehttp://www.bkjia.com/PHPjc/508875.html技術記事原則: サイトのソース ファイルを読み取り、正規表現を使用してソース コードを分析し、すべてのリンクを取得しますか? /**********秋水烏編(2002-5-20)*************/ if(empty(url))url = "http://www. csdn... .
ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
最新の問題
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート