プレーン JavaScript のテキストから HTML タグを削除する
文字列から HTML タグを削除することは、Web 開発における一般的なタスクです。この目的で使用できるライブラリはありますが、プレーンな JavaScript を使用してこれを実現することもできます。
ブラウザの DOM を使用する
コードをブラウザで実行する場合、最も簡単な方法はこのアプローチは、ブラウザーに HTML 解析を処理させることです。これを行うには、一時的な DOM 要素を作成し、その innerHTML プロパティを HTML 文字列に設定します。結果の textContent または innerText プロパティには、HTML タグのないテキストが含まれます。
function stripHtml(html) { let tmp = document.createElement("DIV"); tmp.innerHTML = html; return tmp.textContent || tmp.innerText || ""; }
注意: ユーザーが生成したコンテンツなど、信頼できない入力を処理する場合、このメソッドは注意して使用する必要があります。
DOMParser の使用
代わりの方法は、最新のブラウザで利用できる DOMParser インターフェイスを使用することです。これにより、DOM 要素を作成せずに HTML 文字列を解析できます。
function stripHtml(html) { const doc = new DOMParser().parseFromString(html, "text/html"); return doc.body.textContent; }
正規表現
正規表現は、文字列から HTML タグを削除するために使用することもできますが、このアプローチは一般に、上記の方法に比べて効率も堅牢性も劣ります。
function stripHtml(html) { return html.replace(/<.+?>/g, ""); }
制限事項とセキュリティを考慮することを忘れないでください。ユースケースに適切なソリューションを選択する際の各方法の影響。
以上がプレーンな JavaScript を使用してテキストから HTML タグを効率的に削除する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。