HTML-Tags aus Zeichenfolgen in ASP.NET entfernen
In ASP.NET kann das Entfernen von HTML-Tags aus Zeichenfolgen durch die folgenden Methoden erreicht werden:
Obwohl die Methode zum Ersetzen regulärer Ausdrücke einige Einschränkungen aufweist, kann sie dennoch zuverlässig HTML-Tags aus Zeichenfolgen entfernen:
Suchen und ersetzen Sie „1*(>|$)“.
Normalisieren Sie die Zeichenfolge und ersetzen Sie „[srn]“ durch ein einzelnes Leerzeichen.
Entfernen Sie führende und nachgestellte Leerzeichen aus der Ergebniszeichenfolge.
Beispiel:
Eingabe = "
" cleaning = Regex.Replace(input, "1*(>|$)").Normalize().Trim() Console.WriteLine(cleaned); // Ausgabe: „Hallo“
Hinweis: Diese Methode unterliegt Einschränkungen, wenn sie auf HTML/XML stößt, das „>“ im Attributwert enthält.
Erwägen Sie die Verwendung einer ausgereiften HTML-Parsing-Bibliothek, wie zum Beispiel:
Diese Bibliotheken bieten umfassende und anpassbare HTML-Analyse- und -Bereinigungsfunktionen.
Beispiel (mit HTMLAgilityPack):
mit HtmlAgilityPack; ... HtmlDocument doc = new HtmlDocument(); doc.LoadHtml(Eingabe); Console.WriteLine(doc.DocumentNode.InnerText); // Ausgabe: „Hallo“
Das obige ist der detaillierte Inhalt vonWie entferne ich HTML-Tags effektiv aus Strings in ASP.NET?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!