使用 PHP 的 DOMDocument 和 XPath 解析 HTML
尝试使用 PHP 的 DOMDocument 解析 HTML 时,一个常见问题是在以下标签中查找特定文本特定的课程。在这种情况下,单独使用 DOMDocument::getElementsByTagName 可能不够。
要捕获目标类标签内的特定文本,建议使用 DOMDocument 和 DOMXPath 的替代方法。 DOMXPath 允许强大的 XPath 查询根据元素的属性和结构来定位元素。
考虑以下 HTML:
<div class="main"> <div class="text"> Capture this text 1 </div> </div> <div class="main"> <div class="text"> Capture this text 2 </div> </div>
要检索
php $html = <<loadHTML($html); $xpath = new DOMXPath($dom); $tags = $xpath->query('//div[@class="main"]/div[@class="text"]'); foreach ($tags as $tag) { var_dump(trim($tag->nodeValue)); }
此代码片段将输出:
string 'Capture this text 1' (length=19) string 'Capture this text 2' (length=19)
通过利用 DOMDocument 和 DOMXPath,您可以准确地定位和检索其中的元素HTML 结构,即使在处理特定的类层次结构和内容要求时也是如此。
以上是如何使用 DOMDocument 和 XPath 从特定 HTML 标签中提取文本?的详细内容。更多信息请关注PHP中文网其他相关文章!