Récupération des URL sources des balises d'image HTML à l'aide de techniques d'analyse
Récupération de contenu dynamique, tel que l'URL source de la première balise d'image apparaissant dans un document HTML, est une tâche courante dans le développement Web. Pour y parvenir, des techniques d'analyse HTML telles que DOMDocument et DOMXpath entrent en jeu.
DOMDocument et DOMXpath
DOMDocument représente un document HTML sous forme d'arborescence, permettant d'accéder à son éléments et attributs. DOMXpath fournit un moyen efficace de parcourir cet arbre et d'extraire des valeurs spécifiques.
Solution utilisant DOMDocument et DOMXpath
Exemple
$html = '<img border="0" src="/images/image.jpg" alt="Image" width="100" height="100" />'; $doc = new DOMDocument(); $doc->loadHTML($html); $xpath = new DOMXPath($doc); $src = $xpath->evaluate("string(//img/@src)");
Récupération du Source de la première image
Pour garantir que seule l'URL source de la première image est obtenue, utilisez l'expression XPath string(//img/@src). Cette expression renvoie l'URL source sous forme de chaîne.
Solution one-liner
Pour une solution plus compacte, vous pouvez utiliser la one-liner suivante :
$src = (string) reset(simplexml_import_dom(DOMDocument::loadHTML($html))->xpath("//img/@src"));
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!