A 要素からの href 属性の抽出
Web ページ上のリンクを取得する場合、一般的なアプローチの 1 つは正規表現を使用することです。ただし、href 属性が A タグの最初に配置されていない場合など、特定のシナリオでは問題が発生する可能性があります。
正規表現アプローチ
最初の正規表現。 A タグ内の任意の位置に href 属性がある場合、次のような場合に問題が発生します。 "何?".
DOM ベースのソリューション
信頼性の高い HTML 解析のための正規表現の制限を考慮すると、より堅牢なソリューションは DOMDocument です。 PHPのクラス。次に例を示します。
$dom = new DOMDocument; $dom->loadHTML($html); foreach ($dom->getElementsByTagName('a') as $node) { echo $dom->saveHtml($node), PHP_EOL; }
このコードは、HTML コンテンツを DOMDocument オブジェクトにロードし、getElementsByTagName メソッドを使用してすべての A 要素を取得します。
DOM 操作
DOM を使用すると、A タグに対してさまざまな操作を実行できますelements:
XPath属性抽出:
XPath は、属性抽出のための別のオプションを提供します。以下に例を示します:$xpath = new DOMXPath($dom); $nodes = $xpath->query('//a/@href'); foreach($nodes as $href) { echo $href->nodeValue; }
追加リソース:
以上がHTML の A 要素から href 属性を確実に抽出するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。