抓取A 元素的href 屬性:正規表示式與DOM 解析
嘗試從HTML 頁面中提取連結資訊需要小心處理href屬性。雖然正規表示式提供了一種基本方法,但當 href 屬性未放在 a 標記的第一位時,它們可能會遇到困難。
可靠的替代方案是利用文件物件模型 (DOM) 解析。以下是如何使用 DOM 有效抓取 href 屬性資訊:
$dom = new DOMDocument; $dom->loadHTML($html); foreach ($dom->getElementsByTagName('a') as $node) { echo $dom->saveHtml($node), PHP_EOL; }
此程式碼尋找並輸出 $html 字串中所有 A 元素的「outerHTML」。
此外,DOM 還提供了以下功能:
$nodes = $xpath->query('//a/@href'); foreach ($nodes as $href) { echo $href->nodeValue; // echo current attribute value }
以上是正規表示式與 DOM 解析:哪一種最適合從 HTML 提取 `href` 屬性?的詳細內容。更多資訊請關注PHP中文網其他相關文章!