ホームページ > バックエンド開発 > PHPチュートリアル > Web サイトのコンテンツを収集し、何行で停止します。操作方法

Web サイトのコンテンツを収集し、何行で停止します。操作方法

WBOY
リリース: 2016-06-13 12:46:36
オリジナル
842 人が閲覧しました

Web サイトのコンテンツを収集し、何行で停止します。やり方は!

<br />
<br />
function get_content_by_socket($url){ <br />
$url = eregi_replace('^http://', '', $url);<br />
$temp = explode('/', $url);<br />
$host = array_shift($temp);<br />
$url = ''.implode('/', $temp);<br />
$temp = explode(':', $host);<br />
$host = $temp[0];<br />
$port = isset($temp[1]) ? $temp[1] : 80;<br />
//echo $url;<br />
//echo $host;<br />
   $fp = fsockopen($host, 80) or die("Open ". $url ." failed"); <br />
    $header = "GET /".$url ." HTTP/1.1\r\n"; <br />
    $header .= "Accept: */*\r\n"; <br />
    $header .= "Accept-Language: zh-cn\r\n"; <br />
   $header .= "Accept-Encoding: gzip, deflate\r\n"; <br />
   $header .= "If-Modified-Since: Tue, 06 Apr 2010 07:56:03 GMT; length=2235\r\n"; <br />
    $header .= "User-Agent: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; GTB6.4)\r\n"; <br />
    $header .= "Host: ". $host ."\r\n"; <br />
	$header .= "Referer: http://video.baidu.com/v?word=11&ct=301989888&rn=20&pn=0&db=0&s=0&fbl=800\r\n"; <br />
	//fputs($content, "Referer: $domainrn");//伪造部分 <br />
    $header .= "Connection: Keep-Alive\r\n"; <br />
    $header .= "Cookie: BAIDUID=5F96971273579588527A980F307E8B7A:FG=1\r\n\r\n"; <br />
    //$header .= "Connection: Close\r\n\r\n"; <br />
<br />
    fwrite($fp, $header); <br />
    while (!feof($fp)) { <br />
        $contents .= fgets($fp, 8192); <br />
    } <br />
    fclose($fp); <br />
    return $contents; <br />
} <br />
ログイン後にコピー


この関数を例として取り上げます

10行目を読んだ限り以下は取られず、出力内容はそのまま終了します!このようにして、必要なものを入手し、時間とリソースを節約できます。
または、カスタマイズするフィールド
を読んでください。 それは達成可能ですか?

関連ラベル:
ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート