如何使用 DOMDocument 和 XPath 从 HTML 中定位和提取特定文本内容？-php教程-PHP中文网

首页

后端开发

php教程

如何使用 DOMDocument 和 XPath 从 HTML 中定位和提取特定文本内容？

Mary-Kate Olsen

Oct 30, 2024 am 09:51 AM

How can DOMDocument and XPath be used to Target and Extract Specific Text Content from HTML?

针对特定内容的 DOMDocument 解析

使用强大的 PHP 库“DOMDocument”可以精确解析 HTML 文档。与检索具有特定名称的所有标签的“getElementsByTagName”不同，此方法利用 XPath 查询来有效地定位所需的元素。

捕获特定上下文中的文本节点

到提取特定文本内容，该过程涉及：

使用“DOMDocument::loadHTML”将 HTML 字符串加载到 DOM 对象中。
使用“new DOMXPath”启动“XPath”对象($dom)"。
使用指定目标节点的 XPath 查询。例如：

$tags = $xpath->query('//div[@class="main"]/div[@class="text"]');

登录后复制

此查询检索所有

嵌套在

中的“text”类标签具有“main”类的标签。

使用“foreach”循环迭代生成的元素列表可以提取“nodeValue”，其中包含实际文本：

foreach ($tags as $tag) {
    var_dump(trim($tag->nodeValue));
}

登录后复制

示例实现

考虑以下 HTML 片段：

<code class="html"><div class="main">
    <div class="text">
    Capture this text 1
    </div>
</div>

<div class="main">
    <div class="text">
    Capture this text 2
    </div>
</div></code>

登录后复制

使用提供的查询，输出将是：

string 'Capture this text 1' (length=19)
string 'Capture this text 2' (length=19)

登录后复制

This演示使用“DOMDocument”和 XPath 在分层 HTML 结构中精确提取特定文本内容的能力。

以上是如何使用 DOMDocument 和 XPath 从 HTML 中定位和提取特定文本内容？的详细内容。更多信息请关注PHP中文网其他相关文章！

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

热AI工具

Undresser.AI Undress

人工智能驱动的应用程序，用于创建逼真的裸体照片

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

免费脱衣服图片

Clothoff.io

AI脱衣机

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸！

显示更多

热工具

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

中文版，非常好用

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

显示更多

热门话题

Java教程

1672

CakePHP 教程

1428

Laravel 教程

1332

PHP教程

1277

C# 教程

1257

显示更多

Related knowledge

说明PHP中的安全密码散列（例如，password_hash，password_verify）。为什么不使用MD5或SHA1？ Apr 17, 2025 am 12:06 AM

在PHP中，应使用password_hash和password_verify函数实现安全的密码哈希处理，不应使用MD5或SHA1。1)password_hash生成包含盐值的哈希，增强安全性。2)password_verify验证密码，通过比较哈希值确保安全。3)MD5和SHA1易受攻击且缺乏盐值，不适合现代密码安全。

PHP类型提示如何起作用，包括标量类型，返回类型，联合类型和无效类型？ Apr 17, 2025 am 12:25 AM

PHP类型提示提升代码质量和可读性。1)标量类型提示：自PHP7.0起，允许在函数参数中指定基本数据类型，如int、float等。2)返回类型提示：确保函数返回值类型的一致性。3)联合类型提示：自PHP8.0起，允许在函数参数或返回值中指定多个类型。4)可空类型提示：允许包含null值，处理可能返回空值的函数。

PHP和Python：解释了不同的范例 Apr 18, 2025 am 12:26 AM

PHP主要是过程式编程，但也支持面向对象编程（OOP）；Python支持多种范式，包括OOP、函数式和过程式编程。PHP适合web开发，Python适用于多种应用，如数据分析和机器学习。

PHP和Python：代码示例和比较 Apr 15, 2025 am 12:07 AM

PHP和Python各有优劣，选择取决于项目需求和个人偏好。1.PHP适合快速开发和维护大型Web应用。2.Python在数据科学和机器学习领域占据主导地位。

您如何防止PHP中的SQL注入？（准备的陈述，PDO） Apr 15, 2025 am 12:15 AM

在PHP中使用预处理语句和PDO可以有效防范SQL注入攻击。1)使用PDO连接数据库并设置错误模式。2)通过prepare方法创建预处理语句，使用占位符和execute方法传递数据。3)处理查询结果并确保代码的安全性和性能。

PHP：处理数据库和服务器端逻辑 Apr 15, 2025 am 12:15 AM

PHP在数据库操作和服务器端逻辑处理中使用MySQLi和PDO扩展进行数据库交互，并通过会话管理等功能处理服务器端逻辑。1）使用MySQLi或PDO连接数据库，执行SQL查询。2）通过会话管理等功能处理HTTP请求和用户状态。3）使用事务确保数据库操作的原子性。4）防止SQL注入，使用异常处理和关闭连接来调试。5）通过索引和缓存优化性能，编写可读性高的代码并进行错误处理。