為了在頁面上查找鏈接,常見的方法是使用正則表達式。然而,在這樣的情況下:
<a title="this" href="that">what?</a>
href 屬性沒有放在a 標籤的最前面,以下正規表示式可能會失敗:
/<a\s[^>]*href=(\"\'??)([^\"\' >]*?)[^>]*>(.*)<\/a>/
為處理HTML 可能具有挑戰性。作為替代方案,請考慮使用 DOM(文件物件模型)來實現此目的。
以下是如何使用 DOM 從 A 檢索 href屬性與其他資訊elements:
$dom = new DOMDocument; $dom->loadHTML($html); // Loop through all 'a' elements foreach ($dom->getElementsByTagName('a') as $node) { // Output the entire 'a' element's outer HTML echo $dom->saveHtml($node), PHP_EOL; // Get the node's text value echo $node->nodeValue; // Check if the node has a 'href' attribute echo $node->hasAttribute( 'href' ); // Get the 'href' attribute's value echo $node->getAttribute( 'href' ); // Change the 'href' attribute's value $node->setAttribute('href', 'something else'); // Remove the 'href' attribute $node->removeAttribute('href'); }
XPath也可以用來查詢特定的屬性,例如href屬性:
$dom = new DOMDocument; $dom->loadHTML($html); $xpath = new DOMXPath($dom); $nodes = $xpath->query('//a/@href'); foreach($nodes as $href) { echo $href->nodeValue; // echo current attribute value $href->nodeValue = 'new value'; // set new attribute value $href->parentNode->removeAttribute('href'); // remove attribute }
使用DOM,可以輕鬆檢索和操作諸如來自A 元素的href 之類的屬性。這種方法提供了比正規表示式更可靠、更靈活的 HTML 處理方式。
以上是如何從 HTML 中的 `` 元素可靠地檢索 `href` 屬性?的詳細內容。更多資訊請關注PHP中文網其他相關文章!