首頁 > 後端開發 > php教程 > 在網頁抓取之前如何有效檢查 PHP 中的 404 錯誤?

在網頁抓取之前如何有效檢查 PHP 中的 404 錯誤?

Linda Hamilton
發布: 2024-12-19 17:44:10
原創
651 人瀏覽過

How Can I Efficiently Check for 404 Errors in PHP Before Web Scraping?

在 PHP 中測試 404 的 URL 的簡單方法

發現您的程式碼由於 URL 返回 404 而遇到問題是網頁抓取中的一個常見痛點。為了有效地解決這個問題,在程式碼開始時實施測試以驗證 URL 是否有 404 個回應至關重要。

雖然使用 @fsockopen() 等建議可能無法解決重定向問題,但更合適的方法是利用捲曲的curl_getinfo()函數。操作方法如下:

// Initialize a cURL handle with the given URL
$handle = curl_init($url);
// Enable return of transfer as a string
curl_setopt($handle, CURLOPT_RETURNTRANSFER, TRUE);
// Get the response (HTML or data linked to the URL)
$response = curl_exec($handle);
// Check for 404 (file not found) response
$httpCode = curl_getinfo($handle, CURLINFO_HTTP_CODE);
// Handle 404
if ($httpCode == 404) {

    /* Perform your custom 404 handling here. */
}
// Close the curl session
curl_close($handle);
// Continue processing with the retrieved $response
登入後複製

透過合併此程式碼,您可以有效地檢查 404 回應,從而允許您的程式碼跳過有問題的 URL 並繼續處理可用的 URL。

以上是在網頁抓取之前如何有效檢查 PHP 中的 404 錯誤?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

來源:php.cn
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
作者最新文章
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板