ホームページ > バックエンド開発 > C++ > 正規表現を使用してすべての HTML タグを効率的に削除するにはどうすればよいですか?

正規表現を使用してすべての HTML タグを効率的に削除するにはどうすればよいですか?

Mary-Kate Olsen
リリース: 2025-01-06 04:47:39
オリジナル
291 人が閲覧しました

How Can I Efficiently Remove All HTML Tags Using Regular Expressions?

HTML タグを効率的に削除するための正規表現

正規表現を使用して HTML タグを削除しようとする場合、タグの取り残しの問題に対処することが重要です終了タグ。この記事では、この課題に対する効率的な解決策を提供します。

提供されたコード:

string sPattern = @"<\/?!?(img|a)[^>]*>";
Regex rgx = new Regex(sPattern);
ログイン後にコピー

最初に出現した を削除しようとします。

望ましい結果を達成するには、正規表現を次のように変更する必要があります:

string sPattern = @"<\/?[^>]*>";
ログイン後にコピー

この更新されたパターンは、タグに関係なく、任意の HTML タグと一致します。

さらに、提供されるコードは、次に示すように、Trim や Replace などの文字列メソッドを利用することで簡素化できます。以下:

string removeTags(string input)
{
    return input.Replace("<[^>]*>", "")
                .Replace("\s+", " ")
                .Trim();
}
ログイン後にコピー

この関数は、すべての HTML タグを効率的に削除し、複数のスペースを 1 つのスペースに置き換え、先頭または末尾のスペースを削除します。

以上が正規表現を使用してすべての HTML タグを効率的に削除するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
著者別の最新記事
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート