JavaScript を使用したプレーン テキスト抽出のための HTML 要素の削除
HTML コンテンツを扱う場合、純粋なテキストを抽出する必要がある状況があります。 HTML 要素タグのないテキスト。 JavaScript は、これを実現する便利な方法を提供します。
問題ステートメント:
ボタンとテキストが
で囲まれた HTML ドキュメントがあります。要素。ボタンをクリックすると、その
内のテキストからすべての HTML 要素タグを削除します。
解決策:
これを実現するには、JavaScript を使用して次の手順に従います。
<code class="javascript">function get_content() { // Get the element by its ID var element = document.getElementById('txt'); // Extract the plain text using either innerText or textContent // Depending on the browser support and specific requirements, you can use either of these methods. var text = element.innerText || element.textContent; // Replace HTML elements with the pure text element.innerHTML = text; }</code>
これを使用することで、関数では、ユーザーがボタンをクリックすると、
内の HTML タグが編集されます。要素は削除され、プレーン テキストのみが残ります。
innerText と textContent:
innerText と textContent のどちらを選択するかは、要件によって異なります。 innerText は、スペース、改行、隠しテキストを含む表示テキストを模倣します。一方、textContent は書式設定や非表示要素をすべて取り除きます。
互換性:
innerText は古い IE ブラウザとの互換性が優れていますが、複雑な HTML には適していない可能性があります。構造物。 textContent は、ブラウザー間でより堅牢かつ一貫した動作を実現するために推奨されます。
以上がJavaScript を使用して HTML からプレーンテキストを抽出するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。