Évitez les interférences de balises HTML avec les expressions régulières
Lors de l'utilisation d'expressions régulières pour le traitement de pages HTML, il est crucial d'éviter les modifications involontaires des balises HTML. . Un défi courant survient lorsque l'on tente de modifier du texte dans des balises, mais l'expression régulière affecte également les balises elles-mêmes.
Considérons l'exemple mentionné où une simple substitution de texte est souhaitée dans une balise HTML spécifique :
<a href="example.com" alt="yasar home page">yasar</a>
Pour mettre en évidence le mot "yasar" avec une classe spécifique, l'expression régulière suivante est utilisée :
preg_replace("/(asf|gfd|oyws)/", '<span>
Cependant, cette expression remplace également de manière inattendue "yasar" dans l'attribut "alt", en modifiant la balise HTML.
Solution utilisant des assertions
Pour éviter ce problème, des assertions peuvent être utilisées pour garantir que le modèle correspond uniquement au texte en dehors des balises HTML. Les assertions sont des expressions de largeur nulle qui testent des conditions spécifiques sans consommer de caractères.
Une approche consiste à utiliser une assertion anticipée négative pour vérifier que le texte correspondant n'est pas immédiatement suivi d'un "<" caractère :
/(asf|foo|barr)(?=[^>]*(<|$))/
Cette expression garantit que le mot correspondant n'apparaît pas dans une balise HTML en vérifiant qu'il est suivi d'un nombre quelconque de caractères non "<" caractères (.[^>]*), puis soit un crochet d'angle d'ouverture < ou la fin de la chaîne $.
Alternativement, une assertion lookbehind peut être utilisée pour tester que le texte correspondant n'est pas précédé de ">" caractère :
(?<=>)(asf|foo|barr)
Cette expression vérifie que le mot correspondant est précédé d'un crochet ouvrant, excluant tout le texte contenu dans la balise HTML.
En incorporant ces assertions dans vos expressions régulières, vous peut garantir que les correspondances de modèles se produisent exclusivement en dehors des balises HTML, empêchant ainsi les modifications involontaires de la structure HTML.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!