Maison développement back-end Golang Comment extraire le contenu des balises HTML à l'aide d'expressions régulières en langage Go

Comment extraire le contenu des balises HTML à l'aide d'expressions régulières en langage Go

Jul 14, 2023 pm 01:18 PM
正则表达式 go语言 html标签

Comment utiliser des expressions régulières pour extraire le contenu des balises HTML dans le langage Go

Introduction :
L'expression régulière est un puissant outil de correspondance de texte, et elle est également largement utilisée dans le langage Go. Dans le scénario de traitement des balises HTML, les expressions régulières peuvent nous aider à extraire rapidement le contenu requis. Cet article expliquera comment utiliser des expressions régulières pour extraire le contenu des balises HTML en langage Go et donnera des exemples de code pertinents.

1. Présenter les packages associés
Tout d'abord, nous devons importer les packages associés : regexp et fmt. Le package regexp prend en charge les expressions régulières et le package fmt est utilisé pour la sortie formatée.

import (
    "fmt"
    "regexp"
)
Copier après la connexion

2. Préparer la chaîne HTML
Ensuite, nous devons préparer une chaîne contenant des balises HTML comme échantillon de test. Par exemple, nous avons une chaîne HTML contenant la balise

:

htmlStr := "<p>这是一个示例</p>"
Copier après la connexion

3. Écrivez des expressions régulières
Avant d'utiliser des expressions régulières pour extraire le contenu des balises HTML, vous devez d'abord écrire l'expression régulière correspondante. Supposons que nous souhaitions extraire le contenu entre les balises

, notre expression régulière pourrait être <p>(.*?)</p>. Parmi eux, .*? signifie faire correspondre n'importe quel caractère, et () signifie un groupe pour extraire le contenu correspondant. <p>(.*?)</p>。其中,.*?表示匹配任意字符,()表示一个分组,将匹配到的内容提取出来。

四、使用正则表达式提取内容
使用regexp包提供的相关函数,我们可以很方便地使用正则表达式提取HTML标签内容。

// 编译正则表达式
pattern, _ := regexp.Compile(`<p>(.*?)</p>`)

// 提取内容
result := pattern.FindStringSubmatch(htmlStr)

// 输出结果
fmt.Println(result[1])
Copier après la connexion

在上面的代码中,我们首先使用regexp.Compile函数编译了我们之前编写好的正则表达式<p>(.*?)</p>
然后,我们使用pattern.FindStringSubmatch函数,将HTML字符串作为参数来提取内容。这个函数会返回一个字符串数组,其中第一个元素是完整匹配的字符串,后面的元素是各个分组的匹配结果。
最后,我们通过fmt.Println函数将结果输出到控制台。

五、完整的示例代码

package main

import (
    "fmt"
    "regexp"
)

func main() {
    // 准备HTML字符串
    htmlStr := "<p>这是一个示例</p>"
  
    // 编译正则表达式
    pattern, _ := regexp.Compile(`<p>(.*?)</p>`)
    
    // 提取内容
    result := pattern.FindStringSubmatch(htmlStr)

    // 输出结果
    fmt.Println(result[1])
}
Copier après la connexion

运行上述代码,我们将得到输出结果:这是一个示例

4. Utilisez des expressions régulières pour extraire du contenu

En utilisant les fonctions associées fournies par le package regexp, nous pouvons facilement utiliser des expressions régulières pour extraire le contenu des balises HTML.
rrreee

Dans le code ci-dessus, nous utilisons d'abord la fonction regexp.Compile pour compiler l'expression régulière que nous avons écrite avant <p>(.*?)</p> code>.
    Ensuite, nous utilisons la fonction pattern.FindStringSubmatch, en prenant la chaîne HTML comme paramètre pour extraire le contenu. Cette fonction renverra un tableau de chaînes, où le premier élément est la chaîne correspondante complète et les éléments suivants sont les résultats correspondants de chaque groupe.
  1. Enfin, nous affichons le résultat sur la console via la fonction fmt.Println.
  2. 5. Exemple de code complet
  3. rrreee
  4. Exécutez le code ci-dessus, nous obtiendrons le résultat : Ceci est un exemple, c'est ce que nous avons extrait avec succès de la balise HTML.
6. Notes

Lors de l'utilisation d'expressions régulières pour extraire le contenu des balises HTML, il y a plusieurs points à prendre en compte :

🎜🎜 Les expressions régulières doivent être écrites correctement : l'écriture d'expressions régulières est un processus complexe et doit être basée sur des critères spécifiques. Écrivez des expressions appropriées à vos besoins. Vous pouvez vérifier l'exactitude des expressions régulières à l'aide d'un outil de test d'expressions régulières en ligne. 🎜🎜Vous devez utiliser le regroupement correctement : en utilisant des parenthèses, nous pouvons définir le regroupement dans les expressions régulières. Le contenu groupé est accessible via le tableau renvoyé. 🎜🎜Vous devez faire attention au format de la chaîne HTML : lorsque vous utilisez des expressions régulières pour extraire le contenu des balises HTML, vous devez vous assurer que le format de la chaîne HTML est conforme à la spécification. Si la chaîne HTML n'est pas correctement formatée, la correspondance peut échouer. 🎜🎜🎜Pour résumer, cet article présente comment utiliser des expressions régulières pour extraire le contenu des balises HTML en langage Go et donne un exemple de code pertinent. J'espère que cet article pourra aider les lecteurs à mieux comprendre et utiliser les expressions régulières en langage Go. 🎜

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

AI Hentai Generator

Générez AI Hentai gratuitement.

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Meilleurs paramètres graphiques
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Comment réparer l'audio si vous n'entendez personne
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Comment déverrouiller tout dans Myrise
4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Quelles bibliothèques sont utilisées pour les opérations du numéro de point flottantes en Go? Quelles bibliothèques sont utilisées pour les opérations du numéro de point flottantes en Go? Apr 02, 2025 pm 02:06 PM

La bibliothèque utilisée pour le fonctionnement du numéro de point flottante dans le langage go présente comment s'assurer que la précision est ...

Quel est le problème avec le fil de file d'attente dans GO's Crawler Colly? Quel est le problème avec le fil de file d'attente dans GO's Crawler Colly? Apr 02, 2025 pm 02:09 PM

Problème de threading de file d'attente dans Go Crawler Colly explore le problème de l'utilisation de la bibliothèque Crawler Crawler dans le langage Go, les développeurs rencontrent souvent des problèmes avec les threads et les files d'attente de demande. � ...

Quelle est la différence entre la structure de définition des mots clés `var` et« type »dans le langage Go? Quelle est la différence entre la structure de définition des mots clés `var` et« type »dans le langage Go? Apr 02, 2025 pm 12:57 PM

Deux façons de définir les structures dans le langage GO: la différence entre les mots clés VAR et le type. Lorsque vous définissez des structures, GO Language voit souvent deux façons d'écrire différentes: d'abord ...

Quelles bibliothèques de GO sont développées par de grandes entreprises ou fournies par des projets open source bien connus? Quelles bibliothèques de GO sont développées par de grandes entreprises ou fournies par des projets open source bien connus? Apr 02, 2025 pm 04:12 PM

Quelles bibliothèques de GO sont développées par de grandes entreprises ou des projets open source bien connus? Lors de la programmation en Go, les développeurs rencontrent souvent des besoins communs, ...

Comment résoudre le problème de conversion de type user_id lors de l'utilisation du flux redis pour implémenter les files d'attente de messages dans le langage Go? Comment résoudre le problème de conversion de type user_id lors de l'utilisation du flux redis pour implémenter les files d'attente de messages dans le langage Go? Apr 02, 2025 pm 04:54 PM

Le problème de l'utilisation de Redessstream pour implémenter les files d'attente de messages dans le langage GO consiste à utiliser le langage GO et redis ...

Dans Go, pourquoi les chaînes d'impression avec println et string () ont-elles des effets différents? Dans Go, pourquoi les chaînes d'impression avec println et string () ont-elles des effets différents? Apr 02, 2025 pm 02:03 PM

La différence entre l'impression de chaîne dans le langage go: la différence dans l'effet de l'utilisation de fonctions println et string () est en Go ...

Que dois-je faire si les étiquettes de structure personnalisées à Goland ne sont pas affichées? Que dois-je faire si les étiquettes de structure personnalisées à Goland ne sont pas affichées? Apr 02, 2025 pm 05:09 PM

Que dois-je faire si les étiquettes de structure personnalisées à Goland ne sont pas affichées? Lorsque vous utilisez Goland pour le développement du langage GO, de nombreux développeurs rencontreront des balises de structure personnalisées ...

Quel est un exemple d'une balise de départ dans HTML? Quel est un exemple d'une balise de départ dans HTML? Apr 06, 2025 am 12:04 AM

Anexampleofastartingtaginhtmlis, qui abinginsaparagraph.startingtagsaressentialtinhtmlastheyinitiateelements, définit les éventualités, et la faculté de réduction des pages et de la construction de la création.

See all articles