Regulärer Ausdruck zum effizienten Entfernen von HTML-Tags
Beim Versuch, HTML-Tags mithilfe regulärer Ausdrücke zu entfernen, ist es wichtig, das Problem des Zurücklassens anzugehen schließende Tags. Dieser Artikel bietet eine effiziente Lösung für diese Herausforderung.
Der bereitgestellte Code:
string sPattern = @"<\/?!?(img|a)[^>]*>"; Regex rgx = new Regex(sPattern);
Versuche, das erste Vorkommen von zu entfernen. und Tags, aber die schließenden Tags werden nicht entfernt.
Um das gewünschte Ergebnis zu erzielen, sollte der reguläre Ausdruck wie folgt geändert werden:
string sPattern = @"<\/?[^>]*>";
Dieses aktualisierte Muster passt zu jedem HTML-Tag, unabhängig von seinem Typ und entfernt sowohl öffnende als auch schließende Tags.
Darüber hinaus kann der bereitgestellte Code durch die Verwendung von Zeichenfolgenmethoden wie Trimmen und Ersetzen vereinfacht werden, wie in der Abbildung dargestellt Folgendes:
string removeTags(string input) { return input.Replace("<[^>]*>", "") .Replace("\s+", " ") .Trim(); }
Diese Funktion entfernt effizient alle HTML-Tags, ersetzt mehrere Leerzeichen durch ein einzelnes Leerzeichen und schneidet alle führenden oder nachgestellten Leerzeichen ab.
Das obige ist der detaillierte Inhalt vonWie kann ich alle HTML-Tags mithilfe regulärer Ausdrücke effizient entfernen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!