Comment analyser le code HTML en PHP
L'analyse du code HTML peut être une tâche complexe, surtout si vous cherchez à extraire des informations spécifiques . Même si les expressions régulières peuvent sembler une option tentante, elles peuvent souvent conduire à un code fragile et à des résultats inattendus. Cet article se concentre sur une approche plus structurée de l'analyse HTML à l'aide du modèle objet de document PHP (DOM).
Utiliser PHP DOM pour extraire le texte d'en-tête
Si vous souhaitez extrayez le texte entre les en-têtes HTML, vous pouvez utiliser le DOM comme ceci :
$str = '<h1>
Ce code va sortie :
Heading 1 T2
Extraction entre les titres
Si votre objectif est d'extraire le contenu entre les titres, vous pouvez exploiter les expressions régulières, mais assurez-vous de tester correctement :
echo preg_replace("#<h1[^\>]*>.*?<\/h1>#", "", $str);
Cela permettra sortie :
Lorem ipsum.The quick red fox...
Conclusion
En utilisant le PHP DOM, vous avez accès à une méthode robuste et fiable pour analyser le code HTML. Si les expressions régulières offrent une alternative, elles exigent de la prudence pour des résultats optimaux.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!