Tag HTML sangat penting semasa membangunkan aplikasi web. Terutamanya dalam bidang pembangunan bahagian hadapan, tag HTML sering digunakan untuk membina susun atur laman web, gaya, dan penampilan aplikasi.
Walau bagaimanapun, kadangkala kita perlu mengekstrak atau memproses data daripada teg ini dan bukannya memaparkan kandungan halaman. Dalam kes ini, cara diperlukan untuk menanggalkan tag HTML dan mengekstrak teks biasa. Proses ini sering dipanggil "penyingkiran tag HTML biasa".
Dalam artikel ini, kami akan memperkenalkan cara menggunakan ungkapan biasa untuk mengalih keluar teg HTML dan mengekstrak teks biasa.
Ekspresi biasa ialah alat pemprosesan teks umum yang boleh digunakan untuk mencari dan menggantikan corak tertentu dalam teks. Dalam PHP, JavaScript dan bahasa pengaturcaraan lain, kita boleh menggunakan ungkapan biasa untuk mewakili corak untuk dicari dan kemudian menggunakannya untuk memproses teks.
Dalam artikel ini, kami akan menggunakan fungsi preg_replace PHP untuk menggantikan teg HTML. Fungsi ini menerima tiga parameter: corak untuk diganti, teks untuk diganti dan teks sumber untuk diimbas.
Berikut ialah contoh kod PHP untuk mendapatkan teks daripada tag HTML tanpa menggunakan ungkapan biasa:
$html_text = '<p>这是一个段落。</p><div><h1>这是一个标题</h1></div>'; $text = strip_tags($html_text); echo $text;
Dalam contoh ini kami akan memasukkan aksara tag HTML Rentetan yang dihantar ke fungsi strip_tags PHP kepada tanggalkan semua tag HTML. Fungsi ini adalah fungsi terbina dalam PHP dan sangat mudah digunakan.
Cara lain ialah menggunakan ungkapan biasa. Berikut ialah contoh kod PHP menggunakan fungsi preg_replace untuk mengalih keluar teg HTML:
$html_text = '<p>这是一个段落。</p><div><h1>这是一个标题</h1></div>'; $pattern = '/<[^>]*>/'; $text = preg_replace($pattern, '', $html_text); echo $text;
Dalam contoh ini, kami menggunakan corak ungkapan biasa "/<1*>/" untuk memadankan teg HTML. Corak ini memberitahu enjin ekspresi biasa untuk memadankan mana-mana rentetan yang bermula dengan "<" dan berakhir dengan ">" dan mengandungi sifar atau lebih bukan-">" Corak ini akan sepadan dengan mana-mana teg HTML.
Sekarang kita telah melengkapkan asas ungkapan biasa, berikut ialah beberapa contoh yang lebih kompleks.
Alih keluar teg tertentu
Untuk mengalih keluar teg HTML tertentu, kami boleh memasukkan nama teg ini dalam ungkapan biasa. Sebagai contoh, untuk mengalih keluar semua teg P, kita boleh menggunakan kod berikut:
$pattern = '/<p[^>]*>/'; $text = preg_replace($pattern, '', $html_text);
Dalam contoh ini, kami telah memasukkan nama teg "P" dalam corak dan menggunakan simbol asterisk untuk menunjukkan Sebarang aksara selepas "
Dalam kod di atas, jika kami juga ingin mengalih keluar teg "/p", kami boleh menggunakan kod berikut:
$pattern = '/<[/]?p[^>]*>/'; $text = preg_replace($pattern, '', $html_text);</p> <p>Dalam contoh ini, kami menambah dalam corak An teg penutup pilihan ("</p>") dan simbol tanda soal digunakan untuk menunjukkan bahawa ia adalah pilihan. Corak ini akan sepadan dengan tag P pembukaan dan penutup. </p> <p>Ekstrak pautan</p> <p>Kadangkala, kita perlu mengekstrak data tertentu daripada teg HTML. Sebagai contoh, kita mungkin perlu mengekstrak URL daripada teg pautan. Untuk mengekstrak pautan kita boleh menggunakan kod berikut: </p> <pre class="brush:php;toolbar:false">$html_text = '<a href="http://www.example.com">这是一个链接</a>'; $pattern = '/<a\s+href="([^"]+)">([^<]+)<\/a>/i'; preg_match($pattern, $html_text, $matches); $url = $matches[1]; echo $url;
Dalam contoh ini kita menggunakan corak yang lebih khusus yang sepadan dengan teg "A" dan menggunakan sub-corak , URL dan teks pautan diekstrak .
Dalam ungkapan biasa, kami menggunakan pengubah suai "/i" untuk menjadikan padanan tidak sensitif huruf besar-besaran. Pengubah suai ini sangat berguna apabila kita mencari atribut dan nilai atribut tag.
Ringkasan
Dalam artikel ini, kami memperkenalkan ungkapan biasa dan aplikasinya dalam mengalih keluar teg HTML. Kami meneroka beberapa corak regex biasa, termasuk mengalih keluar semua teg, mengalih keluar teg tertentu dan mengekstrak pautan.
Untuk menjadi pembangun web yang baik, kita perlu mempunyai pemahaman yang mendalam tentang teg HTML dan ungkapan biasa. Menggunakan ungkapan biasa untuk mengalih keluar teg HTML boleh meningkatkan kecekapan kami dan prestasi aplikasi web.
Atas ialah kandungan terperinci Bagaimana untuk membuang tag html dengan ungkapan biasa. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!