如何使用 PHP 的 DOMDocument 和 XPath 從 HTML 中提取特定文字?

DDD
發布: 2024-11-01 13:00:03
原創
375 人瀏覽過

How do I extract specific text from HTML using PHP's DOMDocument and XPath?

使用PHP 的DOMDocument 解析HTML

要使用PHP 的DOMDocument 從HTML 中提取特定文本元素,利用更依賴XPath 文本,利用更依賴XPath有效在DOMDocument::getElementsByTagName 上。 XPath 查詢允許根據文件結構中的特定條件進行精確選擇。

從巢狀 DIV 擷取文字

提供的範例 HTML 包含巢狀

。標籤,其中目標文字位於
內具有「text」類別的元素,這些元素又會嵌套在
中。

要擷取目標文本,可以使用 XPath 查詢:

<code class="php">$xpath->query('//div[@class="main"]/div[@class="text"]');</code>
登入後複製

此查詢選擇所有

元素。類別屬性設定為“text”並且是
的後代的元素類別屬性設定為“main”的元素。結果是匹配元素的列表。

迭代與擷取節點值

要存取實際的文字內容,可以迭代每個符合元素及其節點值存取的屬性:

<code class="php">foreach ($tags as $tag) {
    var_dump(trim($tag->nodeValue));
}</code>
登入後複製

trim() 函數用於從提取的文字中刪除任何前導或尾隨空格。

執行輸出

執行程式碼將輸出以下內容:

string 'Capture this text 1' (length=19)
string 'Capture this text 2' (length=19)
登入後複製

以上是如何使用 PHP 的 DOMDocument 和 XPath 從 HTML 中提取特定文字?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

來源:php.cn
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板
關於我們 免責聲明 Sitemap
PHP中文網:公益線上PHP培訓,幫助PHP學習者快速成長!