DOMDocument en PHP : préserver les nœuds HTML
Introduction
Lorsque vous travaillez avec des documents DOM dans PHP, comprendre la nature hiérarchique des nœuds est crucial pour analyser et manipuler efficacement les documents XML ou HTML. Explorons comment préserver les nœuds HTML à l'aide de DOMDocument.
Hiérarchie et nœuds DOMDocument
Chaque élément d'un DOMDocument représente un nœud. Les nœuds peuvent être de différents types, notamment des éléments (tels que
Préserver les nœuds HTML
Pour préserver les nœuds HTML, nous devons reconnaître que chaque élément, y compris ses attributs et le contenu du texte, est représenté comme un nœud distinct dans l'arborescence DOM. Lors de la requête d'éléments à l'aide de XPath ou d'autres méthodes, il est essentiel de prendre en compte tous les nœuds associés.
Extrait de code
Le code fourni vise à extraire et afficher le contenu de
$dom = new DOMDocument(); @$dom->loadHTML($html); $xpath = new DOMXPath($dom); $tags = $xpath->query('.//div[@id="showContent"]//tr'); foreach ($tags as $tag) { echo $dom->saveXML($tag); echo '<br>'; }</p> <p>Dans ce code modifié :</p> <ul><li>$dom->saveXML($tag) génère la représentation XML du nœud, y compris son enfant éléments et attributs, préservant ainsi les balises HTML.</li></ul> <p><strong>Nœud spécifique Requêtes</strong></p> <p>Si vous devez extraire des informations spécifiques, telles que des liens d'une table, vous pouvez utiliser des méthodes telles que :</p> <pre class="brush:php;toolbar:false">$div = $dom->getElementById('showContent'); foreach ($div->getElementsByTagName('a') as $link) { echo $dom->saveXML($link); }
Conclusion
DOM fournit un ensemble d'outils complet pour analyser et manipuler des documents structurés. En comprenant la structure arborescente DOM et en préservant les nœuds HTML, vous pouvez traiter et extraire efficacement des informations significatives des pages Web.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!