Maison > développement back-end > C++ > Comment supprimer les balises HTML d'un document utilisant des expressions régulières C #?

Comment supprimer les balises HTML d'un document utilisant des expressions régulières C #?

DDD
Libérer: 2025-01-25 11:17:09
original
541 Les gens l'ont consulté
<p> <img src="/static/imghw/default1.png" data-src="https://img.php.cn/upload/article/000/000/000/173777503111682.jpg" class="lazy" alt="How to Remove HTML Tags from a Document Using C# Regular Expressions? "> </p> <c> Utilisez C # Expression régulière pour supprimer la balise HTML <p> <strong> </strong> Lors du traitement du contenu HTML, la suppression des étiquettes est essentielle pour l'extraction des données ou l'analyse de texte. Une méthode consiste à utiliser l'expression régulière C # pour effectuer cette tâche. </p> <p> Question: </p> Comment utiliser l'expression régulière C # pour supprimer toutes les balises HTML (y compris les parenthèses) du document HTML? <p> <strong> Code: </strong> </p> <p> <strong> Explication: </strong> </p> <div class="code" style="position:relative; padding:0px; margin:0px;"><pre class='brush:php;toolbar:false;'>string htmlDocument = @"<p><b>Example text</b> containing tags</p>"; string result = Regex.Replace(htmlDocument, @"<[^>]*>", String.Empty); Console.WriteLine(result); // 输出:Example text containing tags</pre><div class="contentsignin">Copier après la connexion</div></div> <p> Mode d'expression régulière <strong> Faites correspondre toute étiquette (à l'exclusion des symboles de changement) à la fin de </strong>. </p> <ul> Méthodes Remplacez tous les modes de correspondance en chaîne vide. <li> <code><[^>]*></code> Cette méthode supprime efficacement toutes les balises des documents HTML, y compris les supports Sprite. <code><</code> <code>></code> </li> Remarque: <li> <code>Regex.Replace</code> </li> Bien que les expressions régulières soient généralement utiles, il convient de noter qu'ils ont des limites lors du traitement des documents HTML ou XML. Ils ne peuvent pas gérer efficacement les structures imbriquées, ce qui peut entraîner des résultats inattendus dans certains cas (tels que les supports de sprite contenant des CDATA). Par conséquent, pour la structure HTML complexe, il est recommandé d'utiliser un analyseur HTML plus fort. <li> </ul></c>

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal