Entfernen von HTML-Elementen für die Nur-Text-Extraktion mit JavaScript
Beim Umgang mit HTML-Inhalten gibt es Situationen, in denen Sie möglicherweise das Reine extrahieren müssen Text ohne die HTML-Element-Tags. JavaScript bietet eine praktische Möglichkeit, dies zu erreichen.
Problemstellung:
Sie haben ein HTML-Dokument mit einer Schaltfläche und einem Text, der in einem
-Zeichen eingeschlossen ist. Element. Wenn Sie auf die Schaltfläche klicken, möchten Sie alle HTML-Element-Tags aus dem Text innerhalb dieses
entfernen. Element, so dass nur der reine Text übrig bleibt.
Lösung:
Um dies zu erreichen, befolgen Sie diese Schritte mit JavaScript:
<code class="javascript">function get_content() { // Get the element by its ID var element = document.getElementById('txt'); // Extract the plain text using either innerText or textContent // Depending on the browser support and specific requirements, you can use either of these methods. var text = element.innerText || element.textContent; // Replace HTML elements with the pure text element.innerHTML = text; }</code>
Indem Sie dies verwenden Funktion: Wenn der Benutzer auf die Schaltfläche klickt, werden die HTML-Tags im
Das Element wird entfernt, sodass nur der reine Text übrig bleibt.
innerText vs. textContent:
Die Wahl zwischen innerText und textContent hängt von Ihren Anforderungen ab. innerText ahmt den sichtbaren Text nach, einschließlich aller Leerzeichen, Zeilenumbrüche und verborgenen Text. Andererseits entfernt textContent jegliche Formatierung oder versteckte Elemente.
Kompatibilität:
innerText ist besser mit älteren IE-Browsern kompatibel, ist jedoch möglicherweise nicht für komplexes HTML geeignet Strukturen. textContent wird für ein robusteres und konsistenteres Verhalten in allen Browsern empfohlen.
Das obige ist der detaillierte Inhalt vonWie extrahiere ich mit JavaScript einfachen Text aus HTML?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!