發現您的程式碼由於 URL 返回 404 而遇到問題是網頁抓取中的一個常見痛點。為了有效地解決這個問題,在程式碼開始時實施測試以驗證 URL 是否有 404 個回應至關重要。
雖然使用 @fsockopen() 等建議可能無法解決重定向問題,但更合適的方法是利用捲曲的curl_getinfo()函數。操作方法如下:
// Initialize a cURL handle with the given URL $handle = curl_init($url); // Enable return of transfer as a string curl_setopt($handle, CURLOPT_RETURNTRANSFER, TRUE); // Get the response (HTML or data linked to the URL) $response = curl_exec($handle); // Check for 404 (file not found) response $httpCode = curl_getinfo($handle, CURLINFO_HTTP_CODE); // Handle 404 if ($httpCode == 404) { /* Perform your custom 404 handling here. */ } // Close the curl session curl_close($handle); // Continue processing with the retrieved $response
透過合併此程式碼,您可以有效地檢查 404 回應,從而允許您的程式碼跳過有問題的 URL 並繼續處理可用的 URL。
以上是在網頁抓取之前如何有效檢查 PHP 中的 404 錯誤?的詳細內容。更多資訊請關注PHP中文網其他相關文章!