ホームページ > ウェブフロントエンド > jsチュートリアル > 正規表現を使用して JavaScript の文字列から HTML タグを削除する方法

正規表現を使用して JavaScript の文字列から HTML タグを削除する方法

Barbara Streisand
リリース: 2024-10-29 02:41:02
オリジナル
649 人が閲覧しました

How to Remove HTML Tags from Strings in JavaScript using Regular Expressions?

JavaScript の文字列から HTML タグを削除する

文字列から HTML タグを削除することは、テキストの解析など、さまざまな Web 開発タスクに不可欠です。 DOM またはコンテンツを安全にレンダリングします。 JavaScript では、これは正規表現によって実現できます。

正規表現の解決策:

<code class="javascript">const cleanText = strInputCode.replace(/<\/[^>]+(>|$)/g, "");</code>
ログイン後にコピー

この正規表現は、オプションのスラッシュが後に続く開始 HTML タグ (<) を対象としています。 (/)、終了タグ (>) 以外の任意の数の文字、および終了タグ (>) または文字列の末尾 ($) のいずれか。

説明:

  • <: HTML の開始タグと一致します。
  • /: 自己終了タグのオプションのスラッシュと一致します。
  • [^>] :終了タグではない 1 つ以上の文字と一致します。

  • (>|$): 終了タグまたは文字列の末尾のいずれかに一致します。
  • 例:

    • " собаки" => "собаки"
    • "Ивано́в" => "Ивано́в"
    • " чем можно угостить" => " чем можно угостить"

    制限:

    この正規表現は有効ですが、制限があります。整形式ではないタグや、特定の文字を含む属性が含まれているタグは削除できない場合があります。

    代替ソリューション:

    より堅牢なタグ削除については、パーサーの使用を検討してください。 DOM のように。ただし、このアプローチは DOM へのアクセスが必要であり、すべてのシナリオに適しているわけではありません。

    追加の注意事項:

    • 使用する前に入力文字列が信頼できることを確認してください。この正規表現は、潜在的に悪意のある HTML を処理しないためです。
    • 悪意のある入力に対する包括的な保護のために、sanitize-html などのサニタイザーの使用を検討してください。

    以上が正規表現を使用して JavaScript の文字列から HTML タグを削除する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
著者別の最新記事
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート