データ収集時にnotfoundの問題を解決するにはどうすればよいですか?

WBOY
リリース: 2016-06-23 14:12:10
オリジナル
1597 人が閲覧しました

file_get_contents を使用して not found を表示します
curl を使用して 302 found を表示します
ただし、直接開くことができます
解決方法


ディスカッションに返信 (解決策)

302 ジャンプしたので、コードを投稿して確認してください。

$url='http://www.baidu.com/link?url=0vb3_E6Y0Y3wZnKiqd0vhen9tAWVEpKiSqZlnyFDHx-hiORoCPFQUsj3f3hhqZldG6yzMuxJqswRj7scsSwgBf2bMqLLDpW';
$ch=curl_init();
curl_setopt($ch, CURLOPT_URL, $url); ch , CURLOPT_HEADER, 0);
curl_setopt($ch, CURLOPT_RETURNTRANSFER,1);
echo $data=curl_exec($ch)

この URL は Baidu から選択しました

Baidu を使おうとしましたが、思ったほどスロットがありません

$url='http://www.baidu.com/link?url=0vb3_E6Y0Y3wZnKiqd0vhen9tAWVEpKiSqZlnyFDHx-hiORoCPFQUsj3f3hhqZldG6yzMuxJqswRj7scsSwgBf2bMqLLDpW';$ch = curl_init();curl_setopt($ch, CURLOPT_URL,$url);curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);curl_setopt($ch, CURLOPT_HEADER, true);		curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.9.2) Gecko/20100115 Firefox/3.6 (.NET CLR 3.5.30729)');curl_setopt($ch, CURLOPT_FOLLOWLOCATION,1); $html = curl_exec($ch);curl_close($ch);preg_match_all('/^Location: (?P<location>.*?)$/m', $html, $matches);echo trim($matches['location'][0]);//http://www.qzwb.com/jk/content/2013-05/29/content_4458231.htm
ログイン後にコピー

file_get_contents を使用して not found を表示します

curl を使用して 302 found を表示します

でも直接開くことができます
解決方法

投稿完了率: 0%、20 ポイントが必要です。必ず結び付けてください。

見つからないを表示するには file_get_contents を使用します

見つかった 302 を表示するには、curl を使用します
ただし、直接開くこともできます
解決方法

成約率: 0%、20 ポイント後に閉じることを忘れないでください。
そうではありません。 http://www.qzwb.com/jk/content/2013-05/29/content_4458231.htm からコンテンツを抽出したいのですが、開くことができません

ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート