在ASP.NET中去除字符串中的HTML标签
在ASP.NET中,去除字符串中的HTML标签可以通过以下几种方法实现:
尽管正则表达式替换方法存在一些局限性,但它仍然可以可靠地去除字符串中的HTML标签:
查找并替换"1*(>|$)".
将字符串规范化,将"[srn] "替换为单个空格。
去除结果字符串的首尾空格。
示例:
输入 = "
" cleaned = Regex.Replace(输入, "1*(>|$)").Normalize().Trim() Console.WriteLine(cleaned); // 输出: "Hello"
注意: 当遇到属性值中包含">"的HTML/XML时,此方法存在局限性。
考虑使用成熟的HTML解析库,例如:
这些库提供了全面且可定制的HTML解析和清理功能。
示例 (使用HTMLAgilityPack):
using HtmlAgilityPack; ... HtmlDocument doc = new HtmlDocument(); doc.LoadHtml(输入); Console.WriteLine(doc.DocumentNode.InnerText); // 输出: "Hello"
以上是如何有效地从 ASP.NET 中的字符串中删除 HTML 标签?的详细内容。更多信息请关注PHP中文网其他相关文章!