Comment extraire le texte de balises HTML spécifiques à l'aide de DOMDocument et XPath ?

Linda Hamilton
Libérer: 2024-10-31 13:14:20
original
501 Les gens l'ont consulté

How to Extract Text from Specific HTML Tags Using DOMDocument and XPath?

Analyse HTML avec DOMDocument et XPath de PHP

Lorsque vous essayez d'analyser du HTML à l'aide du DOMDocument de PHP, un problème courant est de trouver du texte spécifique dans les balises de classes particulières. L'utilisation de DOMDocument::getElementsByTagName seule peut ne pas suffire dans de tels cas.

Pour capturer un texte spécifique dans les balises d'une classe cible, une approche alternative utilisant DOMDocument et DOMXPath est recommandée. DOMXPath permet de puissantes requêtes XPath pour localiser des éléments en fonction de leurs attributs et de leur structure.

Considérez le code HTML suivant :

<div class="main">
    <div class="text">
    Capture this text 1
    </div>
</div>

<div class="main">
    <div class="text">
    Capture this text 2
    </div>
</div>
Copier après la connexion

Pour récupérer le texte dans le fichier

balises avec class="text" qui sont des descendants des balises
balises avec class="main", suivez ces étapes :

php
$html = <<loadHTML($html);

$xpath = new DOMXPath($dom);

$tags = $xpath->query('//div[@class="main"]/div[@class="text"]');
foreach ($tags as $tag) {
    var_dump(trim($tag->nodeValue));
}
Copier après la connexion

Cet extrait de code affichera :

string 'Capture this text 1' (length=19)
string 'Capture this text 2' (length=19)
Copier après la connexion

En utilisant DOMDocument et DOMXPath, vous pouvez localiser et récupérer avec précision les éléments contenus dans une structure HTML, même lorsqu'il s'agit de hiérarchies de classes et d'exigences de contenu spécifiques.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Derniers articles par auteur
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal
À propos de nous Clause de non-responsabilité Sitemap
Site Web PHP chinois:Formation PHP en ligne sur le bien-être public,Aidez les apprenants PHP à grandir rapidement!