Maison > développement back-end > tutoriel php > Comment exclure les balises HTML de la détection et du remplacement d'URL de texte ?

Comment exclure les balises HTML de la détection et du remplacement d'URL de texte ?

Barbara Streisand
Libérer: 2024-10-28 04:53:30
original
306 Les gens l'ont consulté

How to Exclude HTML Tags from Text URL Detection and Replacement?

Exclure les balises HTML de la détection et du remplacement des URL de texte

Dans votre quête pour convertir les URL de texte brut en balises d'ancrage HTML, en excluant celles du HTML balises, vous avez rencontré un obstacle avec votre regex actuelle. Cet article vise à fournir une solution complète à ce défi.

Votre approche regex actuelle détecte et remplace efficacement les URL dans le texte, mais elle cible également par erreur les URL dans les balises HTML. Pour remédier à cela, nous devons utiliser une approche plus ciblée.

Utiliser XPath pour identifier les URL éligibles

Au lieu d'une recherche de texte large, nous pouvons utiliser XPath pour sélectionner précisément nœuds de texte contenant des URL qui ne sont pas des descendants d'éléments d'ancrage. Cela garantit que les URL dans les balises HTML ne sont pas affectées.

$xPath = new DOMXPath($dom);
$texts = $xPath->query('/html/body//text()[not(ancestor::a) and (contains(., "http://") or contains(., "https://") or contains(., "ftp://"))]');
Copier après la connexion

Remplacement des nœuds de texte par des fragments de document

Plutôt que de modifier directement les nœuds de texte, nous utiliserons le document fragments pour remplacer le nœud de texte entier par le code HTML souhaité. Cette technique non standard rationalise le processus.

foreach ($texts as $text) {
    $fragment = $dom->createDocumentFragment();
    $fragment->appendXML(
        preg_replace("~((?:http|https|ftp)://(?:\S*?\.\S*?))(?=\s|\;|\)|\]|\[|\{|\}|,|\&quot;|'|:|\<|$|\.\s)~i", '<a href=&quot;&quot;></a>', $text->data)
    );
    $text->parentNode->replaceChild($fragment, $text);
}
Copier après la connexion

Sortie

Cette approche convertit efficacement les URL éligibles en texte brut en balises d'ancrage HTML, tout en excluant celles au sein du HTML. balises. Le HTML résultant reflétera les conversions souhaitées sans aucune modification indésirable.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Derniers articles par auteur
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal