使用PHP 的DOMDocument 解析HTML
要使用PHP 的DOMDocument 從HTML 中提取特定文本元素,利用更依賴XPath 文本,利用更依賴XPath有效在DOMDocument::getElementsByTagName 上。 XPath 查詢允許根據文件結構中的特定條件進行精確選擇。
從巢狀 DIV 擷取文字
提供的範例 HTML 包含巢狀
要擷取目標文本,可以使用 XPath 查詢:
<code class="php">$xpath->query('//div[@class="main"]/div[@class="text"]');</code>
此查詢選擇所有
迭代與擷取節點值
要存取實際的文字內容,可以迭代每個符合元素及其節點值存取的屬性:
<code class="php">foreach ($tags as $tag) { var_dump(trim($tag->nodeValue)); }</code>
trim() 函數用於從提取的文字中刪除任何前導或尾隨空格。
執行輸出
執行程式碼將輸出以下內容:
string 'Capture this text 1' (length=19) string 'Capture this text 2' (length=19)
以上是如何使用 PHP 的 DOMDocument 和 XPath 從 HTML 中提取特定文字?的詳細內容。更多資訊請關注PHP中文網其他相關文章!