Wie extrahiere ich Text aus bestimmten HTML-Tags mithilfe von DOMDocument und XPath?-PHP-Tutorial-php.cn

Heim

Backend-Entwicklung

PHP-Tutorial

Wie extrahiere ich Text aus bestimmten HTML-Tags mithilfe von DOMDocument und XPath?

Oct 31, 2024 pm 01:14 PM

How to Extract Text from Specific HTML Tags Using DOMDocument and XPath?

HTML mit PHPs DOMDocument und XPath analysieren

Beim Versuch, HTML mit PHPs DOMDocument zu analysieren, besteht ein häufiges Problem darin, bestimmten Text in Tags von zu finden bestimmte Klassen. Die alleinige Verwendung von DOMDocument::getElementsByTagName reicht in solchen Fällen möglicherweise nicht aus.

Um spezifischen Text innerhalb von Tags einer Zielklasse zu erfassen, wird ein alternativer Ansatz unter Verwendung von DOMDocument und DOMXPath empfohlen. DOMXPath ermöglicht leistungsstarke XPath-Abfragen zum Auffinden von Elementen basierend auf ihren Attributen und ihrer Struktur.

Beachten Sie den folgenden HTML-Code:

&lt;div class=&quot;main&quot;&gt;
    &lt;div class=&quot;text&quot;&gt;
    Capture this text 1
    &lt;/div&gt;
&lt;/div&gt;

&lt;div class=&quot;main&quot;&gt;
    &lt;div class=&quot;text&quot;&gt;
    Capture this text 2
    &lt;/div&gt;
&lt;/div&gt;

Nach dem Login kopieren

Um den Text innerhalb des <div> Tags mit class="text", die Nachkommen des <div> sind Tags mit class="main", folgen Sie diesen Schritten:

php
$html = <<<HTML
&lt;div class=&quot;main&quot;&gt;
    &lt;div class=&quot;text&quot;&gt;
    Capture this text 1
    &lt;/div&gt;
&lt;/div&gt;

&lt;div class=&quot;main&quot;&gt;
    &lt;div class=&quot;text&quot;&gt;
    Capture this text 2
    &lt;/div&gt;
&lt;/div&gt;
HTML;

$dom = new DOMDocument();
$dom->loadHTML($html);

$xpath = new DOMXPath($dom);

$tags = $xpath->query('//div[@class="main"]/div[@class="text"]');
foreach ($tags as $tag) {
    var_dump(trim($tag->nodeValue));
}

Nach dem Login kopieren

Dieses Code-Snippet gibt Folgendes aus:

string 'Capture this text 1' (length=19)
string 'Capture this text 2' (length=19)

Nach dem Login kopieren

Durch die Verwendung von DOMDocument und DOMXPath können Sie Elemente darin genau lokalisieren und abrufen eine HTML-Struktur, auch wenn es um spezifische Klassenhierarchien und Inhaltsanforderungen geht.

Das obige ist der detaillierte Inhalt vonWie extrahiere ich Text aus bestimmten HTML-Tags mithilfe von DOMDocument und XPath?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website

Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn