ウェブサイト上のページを表示するリクエストがサーバーに送信されると (たとえば、ユーザーがブラウザを通じてページにアクセスしたとき、または Googlebot がページをクロールしたとき)、サーバーは次の応答として HTTP ステータス コードを返します。リクエスト。
このステータス コードはリクエストのステータスに関する情報を提供し、サイトとリクエストされたページについて Googlebot に伝えます。
いくつかの一般的なステータス コードは次のとおりです:
200 – サーバーは Web ページを正常に返しました
404 – 要求された Web ページが存在しません
503 – サーバーがタイムアウトしました
この記事では、 Web ページのリクエスト ステータスは次のようになります:
方法 1、fsockopen を使用します
コードは次のとおりです:
function get_http_code($url="localhost", $port=80, $fsock_timeout=10){ set_time_limit(0); ignore_user_abort(true); // 记录开始时间 list($usec, $sec) = explode(" ", microtime(true)); $timer['start'] = (float)$usec + (float)$sec; // 校验URL if(!preg_match("/^https?:\/\//i", $url)){ $url = "http://".$url; } // 支持HTTPS if(preg_match("/^https:\/\//i", $url)){ $port = 443; } // 解析URL $urlinfo = parse_url($url); if(empty($urlinfo['path'])){ $urlinfo['path'] = '/'; } $host = $urlinfo['host']; $uri = $urlinfo['path'] . (empty($urlinfo['query'])?'':$urlinfo['query']); // 通过fsock打开连接 if(!$fp = fsockopen($host, $port, $errno, $error, $fsock_timeout)){ list($usec, $sec) = explode(" ", microtime(true)); $timer['end'] = (float)$usec + (float)$sec; $usetime = (float)$timer['end'] - (float)$timer['start']; return array('code'=>-1, 'usetime'=>$usetime); } // 提交请求 $status = socket_get_status($fp); $out = "GET {$uri} HTTP/1.1\r\n"; $out .= "Host: {$host}\r\n"; $out .= "Connection: Close\r\n\r\n"; $write = fwrite($fp, $out); if(!$write){ list($usec, $sec) = explode(" ", microtime(true)); $timer['end'] = (float)$usec + (float)$sec; $usetime = (float)$timer['end'] - (float)$timer['start']; return array('code'=>-2, 'usetime'=>$usetime); } $ret = fgets($fp, 1024); preg_match("/http\/\d\.\d\s(\d+)/i", $ret, $m); $code = $m[1]; fclose($fp); list($usec, $sec) = explode(" ", microtime(true)); $timer['end'] = (float)$usec + (float)$sec; $usetime = (float)$timer['end'] - (float)$timer['start']; return array('code'=>$code, 'usetime'=>$usetime); }
file_get_contents は fsockopen 関数の単純なパッケージです。効率は少し劣りますが、クロールは成功します。レートが非常に高いので、スヌーピーに困ったときによく使います。 5.0.0 では、コンテキストのサポートが追加され、ヘッダー情報を送信したり、ユーザー エージェント、リファラー、Cookie をカスタマイズしたりすることもできます。 5.1.0 では、ファイルの一部のみを読み取るための offset パラメータと maxlen パラメータが追加されました。
方法2、snoopy.class.phpを使う
Snoopyはブラウザの機能をシミュレートするために使用されるphpクラスで、Webコンテンツの取得やフォームの送信が可能です。
りー以上がWebページリクエストステータスコードを取得するPHPの例の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。