HTML ist eine wesentliche Technologie beim Webseitendesign und der Schlüssel zur Inhaltsanzeige auf Webseiten. Aber manchmal müssen wir den reinen Textinhalt extrahieren. In diesem Fall müssen wir die HTML-Tags entfernen. In diesem Artikel erfahren Sie, wie Sie reguläre Ausdrücke zum Entfernen von HTML-Tags verwenden.
HTML-Tags werden in spitze Klammern eingeschlossen. In HTML-Tags gibt es viele Attribute, mit denen die Eigenschaften von Elementen definiert werden, z. B. Klasse und ID. Wenn Sie reguläre Ausdrücke zum Entfernen von HTML-Tags verwenden, müssen Sie darauf achten, nicht nur die Tags, sondern auch die Attribute in den Tags zu entfernen.
Der spezifische reguläre Ausdruck lautet wie folgt:
/<[^>]+>/g
Dabei repräsentiert / den Anfang und das Ende des regulären Ausdrucks und das Kleiner-als-Zeichen den Anfang und das Ende des HTML-Tags; stellt jedes Zeichen dar, das nicht übereinstimmt. + bedeutet, dass das übereinstimmende Zeichen ein oder mehrere Male wiederholt werden kann. /g bedeutet Volltextsuche anstelle einer Suche. Zum Beispiel, um alle Tags im folgenden HTML-Code zu entfernen:
<!DOCTYPE html> <html> <head> <title>HTML标签测试</title> </head> <body> <h1>我们来测试一下HTML标签去除吧!</h1> <p>这是一个段落。</p> </body> </html>
var html = 'HTML标签测试 我们来测试一下HTML标签去除吧!
这是一个段落。
'; var pureText = html.replace(/<[^>]+>/g, ''); console.log(pureText);
HTML标签测试我们来测试一下HTML标签去除吧!这是一个段落。
Reguläre Ausdrücke gelten nur für den Klartextinhalt von HTML-Tags und nicht für JavaScript-Code und CSS-Stile in Tags.
Das obige ist der detaillierte Inhalt vonSo entfernen Sie HTML-Tags mithilfe regulärer Ausdrücke. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!