ホームページ バックエンド開発 PHPチュートリアル PHP で Web スクレイピング中に 404 エラーを効果的に処理するにはどうすればよいですか?

PHP で Web スクレイピング中に 404 エラーを効果的に処理するにはどうすればよいですか?

Dec 03, 2024 am 06:48 AM

How to Effectively Handle 404 Errors During Web Scraping in PHP?

PHP で 404 エラーを効率的に処理する方法

Web ページをスクレイピングするときに 404 (Not Found) エラーが発生すると、コード フローが中断される可能性があります。このような中断を回避するには、最初に堅牢な URL 検証を実装することが不可欠です。

fsockopen メソッドの制限

fsockopen() を使用するというブログの提案には、特に次のような場合に制限があります。リダイレクトを扱う。有効な URL であっても、空の $valid 値を返す場合があります。

curl とcurl_getinfo() の紹介

PHP の Curl ライブラリは、リダイレクトとリターンを効果的に処理する代替アプローチを提供します。 curl_getinfo() を使用すると、cURL リクエストの実行後に HTTP ステータス コードを取得できます。以下に、curl を使用して 404 エラーをチェックするサンプル コードを示します。

$handle = curl_init($url);
curl_setopt($handle,  CURLOPT_RETURNTRANSFER, TRUE);

/* Get the HTML or whatever is linked in $url. */
$response = curl_exec($handle);

/* Check for 404 (file not found). */
$httpCode = curl_getinfo($handle, CURLINFO_HTTP_CODE);
if($httpCode == 404) {
    /* Handle 404 here. */
}

curl_close($handle);

/* Handle $response here. */
ログイン後にコピー

このコード内:

  • cURL セッションは、curl_init() を使用して初期化されます。
  • curl_setopt() は $response を返すようにセッションを設定しますstring.
  • curl_exec() はリクエストを実行します。
  • curl_getinfo() は HTTP ステータス コード ($httpCode) を取得します。
  • $httpCode が 404 の場合、コードはerror.

この方法を利用することで、404エラーを効率的に処理できます。スクレイピング コードがスムーズに実行されることを確認します。

以上がPHP で Web スクレイピング中に 404 エラーを効果的に処理するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットな記事タグ

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

11ベストPHP URLショートナースクリプト(無料およびプレミアム) 11ベストPHP URLショートナースクリプト(無料およびプレミアム) Mar 03, 2025 am 10:49 AM

11ベストPHP URLショートナースクリプト(無料およびプレミアム)

Instagram APIの紹介 Instagram APIの紹介 Mar 02, 2025 am 09:32 AM

Instagram APIの紹介

Laravelでフラッシュセッションデータを使用します Laravelでフラッシュセッションデータを使用します Mar 12, 2025 pm 05:08 PM

Laravelでフラッシュセッションデータを使用します

Laravelテストでの簡略化されたHTTP応答のモッキング Laravelテストでの簡略化されたHTTP応答のモッキング Mar 12, 2025 pm 05:09 PM

Laravelテストでの簡略化されたHTTP応答のモッキング

PHPのカール:REST APIでPHPカール拡張機能を使用する方法 PHPのカール:REST APIでPHPカール拡張機能を使用する方法 Mar 14, 2025 am 11:42 AM

PHPのカール:REST APIでPHPカール拡張機能を使用する方法

LaravelのバックエンドでReactアプリを構築する:パート2、React LaravelのバックエンドでReactアプリを構築する:パート2、React Mar 04, 2025 am 09:33 AM

LaravelのバックエンドでReactアプリを構築する:パート2、React

Codecanyonで12の最高のPHPチャットスクリプト Codecanyonで12の最高のPHPチャットスクリプト Mar 13, 2025 pm 12:08 PM

Codecanyonで12の最高のPHPチャットスクリプト

Laravelの通知 Laravelの通知 Mar 04, 2025 am 09:22 AM

Laravelの通知

See all articles