ホームページ > バックエンド開発 > C++ > ASP.NET の文字列から HTML タグを効果的に削除するにはどうすればよいですか?

ASP.NET の文字列から HTML タグを効果的に削除するにはどうすればよいですか?

Susan Sarandon
リリース: 2025-01-11 22:11:48
オリジナル
451 人が閲覧しました

How to Effectively Remove HTML Tags from Strings in ASP.NET?

ASP.NET の文字列から HTML タグを削除します

ASP.NET では、次のメソッドを使用して文字列から HTML タグを削除できます。

正規表現の置換

正規表現による置換方法にはいくつかの制限がありますが、文字列から HTML タグを確実に削除できます。

  1. 1*(>|$)」を検索して置換します。

  2. 「[srn]」を単一のスペースに置き換えて文字列を正規化します。

  3. 結果の文字列から先頭と末尾のスペースを削除します。

例:

入力 = "

  • こんにちは

」 clean = Regex.Replace(input, "1*(>|$)").Normalize().Trim() Console.WriteLine(cleaned) // 出力: "こんにちは"

注: 属性値に「>」を含む HTML/XML が見つかった場合、このメソッドには制限があります。

外部ライブラリを使用する

次のような成熟した HTML 解析ライブラリの使用を検討してください。

  • HTMLAgilityPack
  • HTMLSanitizer
  • 清浄器

これらのライブラリは、包括的でカスタマイズ可能な HTML 解析およびサニタイズ機能を提供します。

例 (HTMLAgilityPack を使用):

HtmlAgilityPack を使用; ... HtmlDocument doc = new HtmlDocument(); doc.LoadHtml(入力); Console.WriteLine(doc.DocumentNode.InnerText); // 出力: "こんにちは"

---
  1. >

以上がASP.NET の文字列から HTML タグを効果的に削除するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
著者別の最新記事
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート