PHP での 404 の URL のテスト: 総合ガイド
URL が予期しない 404 エラーを返すことが判明すると、スクレイピング コードが中断される可能性があります。これに対処するには、コードの先頭にテストを実装して、この特定のステータス コードをチェックすることが不可欠です。
fsockopen アプローチ
推奨される方法の 1 つは、fsockopen を使用することです。 ()。ただし、URL にリダイレクトがある場合、fsockopen() はすべての値に対して空の結果を返す可能性があります。
curl アプローチ
より信頼性の高いアプローチは、PHP のカール バインディングを利用します。 curl では、curl_getinfo() を使用して HTTP エラー コードを取得できます。以下に例を示します。
$handle = curl_init($url); curl_setopt($handle, CURLOPT_RETURNTRANSFER, TRUE); $response = curl_exec($handle); $httpCode = curl_getinfo($handle, CURLINFO_HTTP_CODE); if ($httpCode == 404) { // Handle 404 error here } curl_close($handle); // Handle the response as needed
このコードは、指定された $url のカール ハンドルを初期化し、応答を文字列として返すオプションを設定し、リクエストを実行して、HTTP コードを取得します。コードが 404 の場合は、適切なエラー処理コードに移動します。
結論
curl のcurl_getinfo() 関数を使用すると、コード内の 404 エラーを効果的にチェックできます。 PHP コードのスクレイピングにより、ダウンストリームの中断を防ぎ、データ抽出プロセスの安定性を確保します。
以上がPHP スクレイピング コードで 404 エラーを確実にテストするにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。