如何在不修改 URL 的情況下抓取網頁內容？-php教程-PHP中文網

如何在不修改 URL 的情況下抓取網頁內容？

Linda Hamilton

發布： 2024-11-01 12:24:30

原創

372 人瀏覽過

How to Scrape Web Page Content Without Modifying Your URL?

有效的網頁抓取：維護您的URL

在您的專案中，您面臨著在後台抓取網站內容同時保持您的URL 的挑戰。自己的URL不變。雖然 JavaScript 可以實現這一點，但它會修改 URL。若要解決此問題，請考慮使用 PHP Simple HTML DOM Parser。

這個強大的函式庫可讓您將 HTML 頁面解析為對象，從而可以方便地存取特定元素。透過使用 PHP Simple HTML DOM Parser，您可以在不更改 URL 的情況下有效地抓取網站內容。

例如，如果您希望從Google 主頁抓取所有鏈接，您可以利用以下代碼：

<code class="php">// Parse HTML from a URL
$html = file_get_html('http://www.google.com/');

// Iterate through all image elements
foreach ($html->find('img') as $element) {
    echo $element->src . '<br>';
}

// Iterate through all link elements
foreach ($html->find('a') as $element) {
    echo $element->href . '<br>';
}</code>

登入後複製

此示例演示如何從Google 主頁提取圖像和鏈接，並保留原始頁面URL。

以上是如何在不修改 URL 的情況下抓取網頁內容？的詳細內容。更多資訊請關注PHP中文網其他相關文章！