プレーン JavaScript での HTML タグの削除: 包括的な調査
テキストから HTML タグを削除することは、さまざまなプログラミング アプリケーションで共通の要件です。 JavaScript にはこのタスクを達成するための組み込みメソッドとライブラリがいくつか用意されていますが、この記事では、外部依存関係を持たずに純粋な JavaScript を使用してこのタスクを達成する複雑な詳細を詳しく掘り下げます。
jQuery や正規表現ベースのソリューションなどのライブラリがない場合、最も単純なアプローチは、ブラウザーの固有の機能を利用して HTML を処理します。一時的なドキュメント フラグメントを作成し、HTML を innerHTML プロパティに割り当てることにより、ブラウザはコンテンツをシームレスに解析し、タグなしのテキストを返します。
次の JavaScript 関数は、このアプローチの例です。
function stripHtml(html) { let tmp = document.createElement("DIV"); tmp.innerHTML = html; return tmp.textContent || tmp.innerText || ""; }
この関数は HTML 文字列を入力として受け取り、プレーン テキストを返します。ただし、悪意のあるコードの実行につながる可能性があるため、ユーザーが生成した HTML でこのメソッドを使用することは推奨されないことに注意してください。
これらのシナリオの場合、より安全なアプローチには、導入された API である DOMParser を利用することが含まれます。 HTML5:
function stripHtml(html) { const parser = new DOMParser(); const document = parser.parseFromString(html, "text/html"); return document.documentElement.textContent; }
この関数は、DOMParser を使用して HTML 文字列からドキュメント オブジェクトを作成し、テキスト コンテンツを抽出します。ドキュメントのルート要素から。このアプローチにより、強化されたセキュリティと入力の制御が提供され、信頼できない可能性のある HTML の処理に適しています。
適切な手法の選択は、特定の使用例とセキュリティの考慮事項によって異なります。ほとんどのシナリオでは、innerHTML を使用する最初のアプローチがシンプルさと効率性を提供します。ただし、信頼できない入力を扱う場合は、セキュリティと信頼性を高めるために DOMParser を利用することをお勧めします。
以上がプレーンな JavaScript のみを使用してテキストから HTML タグを削除するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。