Rumah pembangunan bahagian belakang Golang Cara mengekstrak kandungan teg HTML menggunakan ungkapan biasa dalam bahasa Go

Cara mengekstrak kandungan teg HTML menggunakan ungkapan biasa dalam bahasa Go

Jul 14, 2023 pm 01:18 PM
ungkapan biasa pergi bahasa teg html

Cara menggunakan ungkapan biasa untuk mengekstrak kandungan teg HTML dalam bahasa Go

Pengenalan:
Ungkapan biasa ialah alat pemadanan teks yang berkuasa dan ia juga digunakan secara meluas dalam bahasa Go. Dalam senario pemprosesan teg HTML, ungkapan biasa boleh membantu kami mengekstrak kandungan yang diperlukan dengan cepat. Artikel ini akan memperkenalkan cara menggunakan ungkapan biasa untuk mengekstrak kandungan teg HTML dalam bahasa Go dan memberikan contoh kod yang berkaitan.

1. Perkenalkan pakej berkaitan
Pertama, kita perlu mengimport pakej berkaitan: regexp dan fmt. Pakej regexp menyediakan sokongan untuk ungkapan biasa, dan pakej fmt digunakan untuk output yang diformatkan.

import (
    "fmt"
    "regexp"
)
Salin selepas log masuk

2. Sediakan rentetan HTML
Seterusnya, kita perlu menyediakan rentetan yang mengandungi tag HTML sebagai sampel ujian. Sebagai contoh, kami mempunyai rentetan HTML yang mengandungi teg

:

htmlStr := "<p>这是一个示例</p>"
Salin selepas log masuk

3. Tulis ungkapan biasa
Sebelum menggunakan ungkapan biasa untuk mengekstrak kandungan tag HTML, anda perlu menulis ungkapan biasa yang sepadan terlebih dahulu. Katakan kami ingin mengekstrak kandungan antara teg

, ungkapan biasa kami boleh menjadi <p>(.*?)</p>. Antaranya, .*? bermaksud memadankan mana-mana aksara dan () bermaksud kumpulan untuk mengekstrak kandungan yang dipadankan. <p>(.*?)</p>。其中,.*?表示匹配任意字符,()表示一个分组,将匹配到的内容提取出来。

四、使用正则表达式提取内容
使用regexp包提供的相关函数,我们可以很方便地使用正则表达式提取HTML标签内容。

// 编译正则表达式
pattern, _ := regexp.Compile(`<p>(.*?)</p>`)

// 提取内容
result := pattern.FindStringSubmatch(htmlStr)

// 输出结果
fmt.Println(result[1])
Salin selepas log masuk

在上面的代码中,我们首先使用regexp.Compile函数编译了我们之前编写好的正则表达式<p>(.*?)</p>
然后,我们使用pattern.FindStringSubmatch函数,将HTML字符串作为参数来提取内容。这个函数会返回一个字符串数组,其中第一个元素是完整匹配的字符串,后面的元素是各个分组的匹配结果。
最后,我们通过fmt.Println函数将结果输出到控制台。

五、完整的示例代码

package main

import (
    "fmt"
    "regexp"
)

func main() {
    // 准备HTML字符串
    htmlStr := "<p>这是一个示例</p>"
  
    // 编译正则表达式
    pattern, _ := regexp.Compile(`<p>(.*?)</p>`)
    
    // 提取内容
    result := pattern.FindStringSubmatch(htmlStr)

    // 输出结果
    fmt.Println(result[1])
}
Salin selepas log masuk

运行上述代码,我们将得到输出结果:这是一个示例

4 Gunakan ungkapan biasa untuk mengekstrak kandungan

Menggunakan fungsi berkaitan yang disediakan oleh pakej regexp, kami boleh menggunakan ungkapan biasa untuk mengekstrak kandungan tag HTML.
rrreee

Dalam kod di atas, kami mula-mula menggunakan fungsi regexp.Compile untuk menyusun ungkapan biasa yang kami tulis sebelum <p>(.*?)</p> kod>.
    Kemudian, kami menggunakan fungsi pattern.FindStringSubmatch, mengambil rentetan HTML sebagai parameter untuk mengekstrak kandungan. Fungsi ini akan mengembalikan tatasusunan rentetan, di mana elemen pertama ialah rentetan padanan lengkap dan elemen berikut ialah hasil padanan setiap kumpulan.
  1. Akhir sekali, kami mengeluarkan hasilnya ke konsol melalui fungsi fmt.Println.
  2. 5. Lengkapkan kod contoh
  3. rrreee
  4. Jalankan kod di atas, kita akan mendapat output: Ini adalah contoh, inilah yang kami berjaya ekstrak dari tag HTML.
6. Nota

Apabila menggunakan ungkapan biasa untuk mengekstrak kandungan tag HTML, terdapat beberapa perkara yang perlu diberi perhatian:

🎜🎜 Ungkapan biasa perlu ditulis dengan betul: menulis ungkapan biasa adalah proses yang kompleks dan perlu berdasarkan khusus Tulis ungkapan yang sesuai untuk keperluan anda. Anda boleh mengesahkan ketepatan ungkapan biasa menggunakan alat ujian ungkapan biasa dalam talian. 🎜🎜Anda perlu menggunakan pengumpulan dengan betul: Dengan menggunakan kurungan, kami boleh mentakrifkan pengumpulan dalam ungkapan biasa. Kandungan berkumpulan boleh diakses melalui tatasusunan yang dikembalikan. 🎜🎜Anda perlu memberi perhatian kepada format rentetan HTML: Apabila menggunakan ungkapan biasa untuk mengekstrak kandungan tag HTML, anda perlu memastikan bahawa format rentetan HTML mematuhi spesifikasi. Jika rentetan HTML tidak diformat dengan betul, ia boleh menyebabkan perlawanan gagal. 🎜🎜🎜Ringkasnya, artikel ini memperkenalkan cara menggunakan ungkapan biasa untuk mengekstrak kandungan teg HTML dalam bahasa Go dan memberikan kod sampel yang berkaitan. Saya harap artikel ini dapat membantu pembaca lebih memahami dan menggunakan ungkapan biasa dalam bahasa Go. 🎜

Atas ialah kandungan terperinci Cara mengekstrak kandungan teg HTML menggunakan ungkapan biasa dalam bahasa Go. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Tetapan grafik terbaik
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Cara Membuka Segala -galanya Di Myrise
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Perpustakaan apa yang digunakan untuk operasi nombor terapung di GO? Perpustakaan apa yang digunakan untuk operasi nombor terapung di GO? Apr 02, 2025 pm 02:06 PM

Perpustakaan yang digunakan untuk operasi nombor terapung dalam bahasa Go memperkenalkan cara memastikan ketepatannya ...

Apakah masalah dengan thread giliran di crawler colly go? Apakah masalah dengan thread giliran di crawler colly go? Apr 02, 2025 pm 02:09 PM

Masalah Threading Giliran di GO Crawler Colly meneroka masalah menggunakan Perpustakaan Colly Crawler dalam bahasa Go, pemaju sering menghadapi masalah dengan benang dan permintaan beratur. � ...

Apakah perbezaan antara struktur definisi kata kunci `var` dan` type` dalam bahasa Go? Apakah perbezaan antara struktur definisi kata kunci `var` dan` type` dalam bahasa Go? Apr 02, 2025 pm 12:57 PM

Dua cara untuk menentukan struktur dalam bahasa Go: perbezaan antara VAR dan jenis kata kunci. Apabila menentukan struktur, pergi bahasa sering melihat dua cara menulis yang berbeza: pertama ...

Perpustakaan mana yang dibangunkan oleh syarikat besar atau disediakan oleh projek sumber terbuka yang terkenal? Perpustakaan mana yang dibangunkan oleh syarikat besar atau disediakan oleh projek sumber terbuka yang terkenal? Apr 02, 2025 pm 04:12 PM

Perpustakaan mana yang dibangunkan oleh syarikat besar atau projek sumber terbuka yang terkenal? Semasa pengaturcaraan di GO, pemaju sering menghadapi beberapa keperluan biasa, ...

Bagaimana menyelesaikan masalah penukaran jenis user_id semasa menggunakan aliran redis untuk melaksanakan beratur mesej dalam bahasa Go? Bagaimana menyelesaikan masalah penukaran jenis user_id semasa menggunakan aliran redis untuk melaksanakan beratur mesej dalam bahasa Go? Apr 02, 2025 pm 04:54 PM

Masalah menggunakan redisstream untuk melaksanakan beratur mesej dalam bahasa Go menggunakan bahasa Go dan redis ...

Di Go, mengapa rentetan percetakan dengan fungsi println dan rentetan () mempunyai kesan yang berbeza? Di Go, mengapa rentetan percetakan dengan fungsi println dan rentetan () mempunyai kesan yang berbeza? Apr 02, 2025 pm 02:03 PM

Perbezaan antara percetakan rentetan dalam bahasa Go: perbezaan kesan menggunakan fungsi println dan rentetan () sedang ...

Apa yang perlu saya lakukan jika label struktur tersuai di Goland tidak dipaparkan? Apa yang perlu saya lakukan jika label struktur tersuai di Goland tidak dipaparkan? Apr 02, 2025 pm 05:09 PM

Apa yang perlu saya lakukan jika label struktur tersuai di Goland tidak dipaparkan? Apabila menggunakan Goland untuk Pembangunan Bahasa GO, banyak pemaju akan menghadapi tag struktur tersuai ...

Apakah contoh tag permulaan dalam html? Apakah contoh tag permulaan dalam html? Apr 06, 2025 am 12:04 AM

Anexampleofastartartingtaginhtmlis, yangbeginsaparagraph.startingtagsareessentialinhtmlasttheyinitiateelements, definetheirtypes, andarecrucialforstructuringwebpagesandconstructionthedom.

See all articles