HTML ialah teknologi penting dalam reka bentuk halaman Web dan kunci kepada paparan kandungan dalam halaman Web. Tetapi kadangkala kita perlu mengekstrak kandungan teks biasa, kemudian kita perlu mengalih keluar tag HTML. Artikel ini akan memperkenalkan cara menggunakan ungkapan biasa untuk mengalih keluar teg HTML.
Teg HTML disertakan dengan kurungan sudut. Dalam teg HTML, terdapat banyak atribut yang digunakan untuk menentukan ciri elemen, seperti kelas dan id. Apabila menggunakan ungkapan biasa untuk mengalih keluar teg HTML, anda perlu memberi perhatian kepada bukan sahaja mengalih keluar teg, tetapi juga mengalih keluar atribut dalam teg.
Ungkapan biasa yang khusus adalah seperti berikut:
/<[^>]+>/g
Antaranya, / mewakili permulaan dan akhir ungkapan biasa yang lebih besar daripada tanda dan kurang daripada tanda mewakili permulaan dan hujung teg HTML; 1 bermaksud mana-mana aksara yang tidak sepadan>; bukan satu carian.
Sebagai contoh, untuk mengalih keluar semua teg dalam kod HTML berikut:
<!DOCTYPE html> <html> <head> <title>HTML标签测试</title> </head> <body> <h1>我们来测试一下HTML标签去除吧!</h1> <p>这是一个段落。</p> </body> </html>
Anda boleh menggunakan kod berikut dalam JavaScript:
var html = 'HTML标签测试 我们来测试一下HTML标签去除吧!
这是一个段落。
'; var pureText = html.replace(/<[^>]+>/g, ''); console.log(pureText);
Kod di atas akan keluarkan kandungan teks Biasa HTML yang dilucutkan selepas teg:
HTML标签测试我们来测试一下HTML标签去除吧!这是一个段落。
Dengan cara ini, kami telah berjaya mengalih keluar teg HTML. Semasa penggunaan sebenar, anda juga perlu memberi perhatian kepada perkara berikut:
Selain itu, anda juga boleh menggunakan perpustakaan penghuraian HTML khusus untuk mengekstrak teg HTML, seperti Cheerio. Tetapi tidak kira kaedah yang digunakan, kita perlu sentiasa berwaspada untuk memastikan kandungan teks yang diekstrak adalah tepat dan selaras dengan jangkaan.
Atas ialah kandungan terperinci Bagaimana untuk mengalih keluar tag HTML menggunakan ungkapan biasa. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!