Énoncé du problème :
Pour créer une page répertoriant toutes les images d'un site Web, ainsi que leurs titres et représentations alternatives, une méthode pour extraire ces attributs du HTML est requise. L'ordre des attributs peut varier et les obtenir tous pose un défi.
Extraction de données à l'aide d'expressions régulières :
Au départ, le problème peut être abordé en utilisant des expressions régulières expressions. Cependant, en raison de l'ordre variable des attributs, cette méthode n'est pas considérée comme élégante et peut entraîner un processus d'analyse laborieux caractère par caractère.
Solution DOMDocument :
Une approche alternative consiste à utiliser la classe PHP DOMDocument. Cette classe permet l'analyse du HTML et l'accès à ses éléments. Voici le code pour y parvenir :
$url = "http://example.com"; $html = file_get_contents($url); $doc = new DOMDocument(); @$doc->loadHTML($html); $tags = $doc->getElementsByTagName('img'); foreach ($tags as $tag) { echo $tag->getAttribute('src').', '; echo $tag->getAttribute('title').', '; echo $tag->getAttribute('alt').'<br>'; }
Explication :
Ce code initialise un objet DOMDocument et y charge le code HTML. La méthode getElementsByTagName est utilisée pour récupérer toutes les images. Chaque balise img est ensuite itérée et la méthode getAttribute est utilisée pour extraire les attributs src, title et alt. Les données extraites sont mises en écho, ce qui entraîne une sortie formatée des informations d'image.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!