Maison développement back-end Golang requête golang html

requête golang html

May 19, 2023 am 10:46 AM

<p>Avant-propos

<p>Le développement des langages de programmation nous a apporté des possibilités infinies. En tant que langage de programmation moderne, le langage Go présente de nombreux avantages tels que l'efficacité, la simplicité et la multiplateforme. Il est largement utilisé dans la programmation côté serveur, le cloud computing, les conteneurs et d'autres domaines. Cet article explique comment utiliser des bibliothèques tierces pour interroger des documents HTML dans Go.

<p>1. Le langage Go et HTML

<p>HTML est un langage de balisage utilisé pour créer des pages Web. Il peut spécifier la structure et le style des éléments et être utilisé avec d'autres technologies telles que CSS et JavaScript pour obtenir des effets interactifs complexes. Le langage Go est un langage de programmation compilé, typé statiquement et sécurisé, connu pour son efficacité. Bien que le langage Go lui-même ne prenne pas directement en charge l'analyse HTML, nous pouvons accomplir cette tâche en utilisant des bibliothèques tierces.

<p>2. Analyse HTML en langage Go

<p>En langage Go, nous pouvons utiliser une variété d'outils pour analyser des documents HTML, tels que golang.org/x/net/html, github .com/PuerkitoBio/goqueryetc. Ces outils fournissent un ensemble de méthodes et de structures pour analyser, parcourir et modifier des documents HTML. golang.org/x/net/htmlgithub.com/PuerkitoBio/goquery等。这些工具提供了一系列方法和结构,用于解析、遍历和修改 HTML 文档。

<p>2.1 使用 golang.org/x/net/html

<p>golang.org/x/net/html 是 Go 语言提供的一个标准的库,它提供了一个丰富的 API 来解析 HTML 文档。接下来,我们将演示如何使用该库来查询 HTML 文档中的节点数据。

<p>下面是一个简单的 HTML 文档:

<!DOCTYPE html>
<html>
  <head>
    <title>A Simple HTML Document</title>
  </head>
  <body>
    <h1>This is a heading</h1>
    <p>This is a paragraph.</p>
    <p>This is another paragraph.</p>
  </body>
</html>
Copier après la connexion
Copier après la connexion
<p>我们现在要查询该文档中的所有段落节点(<p> 标签)的文本内容。首先,我们需要将 HTML 文档解析为 DOM 树结构,然后通过递归遍历 DOM 树来查询节点数据。

package main

import (
    "fmt"
    "golang.org/x/net/html"
    "strings"
)

var htmlString = `
<!DOCTYPE html>
<html>
  <head>
    <title>A Simple HTML Document</title>
  </head>
  <body>
    <h1>This is a heading</h1>
    <p>This is a paragraph.</p>
    <p>This is another paragraph.</p>
  </body>
</html>
`

func main() {
    reader := strings.NewReader(htmlString)
    doc, err := html.Parse(reader)
    if err != nil {
        fmt.Println("Failed to parse HTML string:", err)
        return
    }
    var find func(*html.Node)
    find = func(n *html.Node) {
        if n.Type == html.ElementNode && n.Data == "p" {
            fmt.Println(n.FirstChild.Data)
        } else {
            for c := n.FirstChild; c != nil; c = c.NextSibling {
                find(c)
            }
        }
    }
    find(doc)
}
Copier après la connexion
<p>在上述代码中,我们使用 strings.NewReader() 将字符串转换为 io.Reader 接口类型,并将其传递给 html.Parse() 函数来解析 HTML 文档。然后,我们定义了一个名为 find() 的递归函数,用于遍历 DOM 树,并查找符合条件的节点。当遇到一个段落节点时,我们输出该节点的文本内容。最后,我们调用 find() 函数来查询并输出所有段落节点的文本内容。

<p>2.2 使用 github.com/PuerkitoBio/goquery

<p>github.com/PuerkitoBio/goquery 是一个很受欢迎的 Go 语言库,它为 HTML 解析和查询提供了一种简单且方便的方式。我们可以使用 goquery 来遍历并查询 HTML 文档,而无需深入了解 DOM 树的结构。

<p>下面是一个示例 HTML 文档:

<!DOCTYPE html>
<html>
  <head>
    <title>A Simple HTML Document</title>
  </head>
  <body>
    <h1>This is a heading</h1>
    <p>This is a paragraph.</p>
    <p>This is another paragraph.</p>
  </body>
</html>
Copier après la connexion
Copier après la connexion
<p>我们现在要查询文档中的所有段落节点的文本内容,使用 goquery 可以轻松实现:

package main

import (
    "fmt"
    "github.com/PuerkitoBio/goquery"
    "strings"
)

var htmlString = `
<!DOCTYPE html>
<html>
  <head>
    <title>A Simple HTML Document</title>
  </head>
  <body>
    <h1>This is a heading</h1>
    <p>This is a paragraph.</p>
    <p>This is another paragraph.</p>
  </body>
</html>
`

func main() {
    reader := strings.NewReader(htmlString)
    doc, err := goquery.NewDocumentFromReader(reader)
    if err != nil {
        fmt.Println("Failed to parse HTML string:", err)
        return
    }
    doc.Find("p").Each(func(i int, s *goquery.Selection) {
        fmt.Println(s.Text())
    })
}
Copier après la connexion
<p>在上述代码中,我们使用 strings.NewReader() 将字符串转换为 io.Reader 接口类型,并将其传递给 goquery.NewDocumentFromReader() 函数来解析 HTML 文档。然后,我们使用 doc.Find("p") 来查询所有段落节点,并通过 s.Text() 方法来输出其文本内容。

<p>三、总结

<p>本文介绍了 Go 语言中如何查询 HTML 文档的内容。我们探讨了两种不同的方法,分别是使用 golang.org/x/net/htmlgithub.com/PuerkitoBio/goquery

2.1 Utilisation golang.org/x/net/html🎜🎜golang.org/x/net/html est une bibliothèque standard fournie par le langage Go, qui fournit Une API riche pour analyser les documents HTML. Ensuite, nous montrerons comment utiliser la bibliothèque pour interroger les données de nœuds dans un document HTML. 🎜🎜Ce qui suit est un simple document HTML : 🎜rrreee🎜Nous souhaitons maintenant interroger le contenu textuel de tous les nœuds de paragraphe (balises <p>) dans ce document. Tout d’abord, nous devons analyser le document HTML dans une structure arborescente DOM, puis interroger les données du nœud en parcourant de manière récursive l’arborescence DOM. 🎜rrreee🎜Dans le code ci-dessus, nous utilisons strings.NewReader() pour convertir la chaîne en type d'interface io.Reader et la transmettre à la fonction html.Parse() analyser des documents HTML. Ensuite, nous définissons une fonction récursive appelée find() qui parcourt l'arborescence DOM et trouve les nœuds qui répondent aux critères. Lorsqu'un nœud de paragraphe est rencontré, nous affichons le contenu textuel de ce nœud. Enfin, nous appelons la fonction find() pour interroger et afficher le contenu textuel de tous les nœuds de paragraphe. 🎜🎜2.2 Utilisation de github.com/PuekitoBio/goquery🎜🎜github.com/PuerkitoBio/goquery est une bibliothèque de langage Go populaire qui analyse et interroge le HTML Fournit un outil simple et pratique chemin. Nous pouvons utiliser goquery pour parcourir et interroger des documents HTML sans avoir à comprendre la structure de l'arborescence DOM. 🎜🎜Ce qui suit est un exemple de document HTML : 🎜rrreee🎜Nous souhaitons maintenant interroger le contenu du texte de tous les nœuds de paragraphe du document, ce qui peut être facilement réalisé en utilisant goquery : 🎜rrreee🎜Dans ce qui précède code, nous utilisons strings.NewReader() Convertit la chaîne en type d'interface io.Reader et la transmet à la fonction goquery.NewDocumentFromReader() pour analyser le document HTML. Ensuite, nous utilisons doc.Find("p") pour interroger tous les nœuds de paragraphe et afficher leur contenu textuel via la méthode s.Text(). 🎜🎜3. Résumé🎜🎜Cet article présente comment interroger le contenu des documents HTML en langage Go. Nous avons exploré deux approches différentes, en utilisant golang.org/x/net/html et github.com/PuerkitoBio/goquery. Ces outils sont non seulement capables d'analyser des documents HTML, mais fournissent également une API riche pour parcourir et manipuler l'arborescence DOM. Quelle que soit la méthode que vous choisissez, vous pouvez facilement obtenir des données à partir de documents HTML, vous aidant ainsi à créer des applications plus élégantes et plus efficaces. 🎜

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

AI Hentai Generator

Générez AI Hentai gratuitement.

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Quelles sont les vulnérabilités de Debian OpenSSL Quelles sont les vulnérabilités de Debian OpenSSL Apr 02, 2025 am 07:30 AM

OpenSSL, en tant que bibliothèque open source largement utilisée dans les communications sécurisées, fournit des algorithmes de chiffrement, des clés et des fonctions de gestion des certificats. Cependant, il existe des vulnérabilités de sécurité connues dans sa version historique, dont certaines sont extrêmement nocives. Cet article se concentrera sur les vulnérabilités et les mesures de réponse communes pour OpenSSL dans Debian Systems. DebianopenSSL CONNUTS Vulnérabilités: OpenSSL a connu plusieurs vulnérabilités graves, telles que: la vulnérabilité des saignements cardiaques (CVE-2014-0160): cette vulnérabilité affecte OpenSSL 1.0.1 à 1.0.1F et 1.0.2 à 1.0.2 Versions bêta. Un attaquant peut utiliser cette vulnérabilité à des informations sensibles en lecture non autorisées sur le serveur, y compris les clés de chiffrement, etc.

Comment utilisez-vous l'outil PPROF pour analyser les performances GO? Comment utilisez-vous l'outil PPROF pour analyser les performances GO? Mar 21, 2025 pm 06:37 PM

L'article explique comment utiliser l'outil PPROF pour analyser les performances GO, notamment l'activation du profilage, la collecte de données et l'identification des goulots d'étranglement communs comme le processeur et les problèmes de mémoire. COMMANDE: 159

Comment rédigez-vous des tests unitaires en Go? Comment rédigez-vous des tests unitaires en Go? Mar 21, 2025 pm 06:34 PM

L'article traite des tests d'unité d'écriture dans GO, couvrant les meilleures pratiques, des techniques de moquerie et des outils pour une gestion efficace des tests.

Quel est le problème avec le fil de file d'attente dans GO's Crawler Colly? Quel est le problème avec le fil de file d'attente dans GO's Crawler Colly? Apr 02, 2025 pm 02:09 PM

Problème de threading de file d'attente dans Go Crawler Colly explore le problème de l'utilisation de la bibliothèque Crawler Crawler dans le langage Go, les développeurs rencontrent souvent des problèmes avec les threads et les files d'attente de demande. � ...

Quelles bibliothèques sont utilisées pour les opérations du numéro de point flottantes en Go? Quelles bibliothèques sont utilisées pour les opérations du numéro de point flottantes en Go? Apr 02, 2025 pm 02:06 PM

La bibliothèque utilisée pour le fonctionnement du numéro de point flottante dans le langage go présente comment s'assurer que la précision est ...

Quelle est la commande Go FMT et pourquoi est-elle importante? Quelle est la commande Go FMT et pourquoi est-elle importante? Mar 20, 2025 pm 04:21 PM

L'article traite de la commande GO FMT dans GO Programming, qui formate le code pour adhérer aux directives de style officiel. Il met en évidence l'importance de GO FMT pour maintenir la cohérence du code, la lisibilité et la réduction des débats de style. Meilleures pratiques pour

Méthode de surveillance postgresql sous Debian Méthode de surveillance postgresql sous Debian Apr 02, 2025 am 07:27 AM

Cet article présente une variété de méthodes et d'outils pour surveiller les bases de données PostgreSQL sous le système Debian, vous aidant à saisir pleinement la surveillance des performances de la base de données. 1. Utilisez PostgreSQL pour reprendre la surveillance Afficher PostgreSQL lui-même offre plusieurs vues pour surveiller les activités de la base de données: PG_STAT_ACTIVITY: affiche les activités de la base de données en temps réel, y compris les connexions, les requêtes, les transactions et autres informations. PG_STAT_REPLIcation: surveille l'état de réplication, en particulier adapté aux grappes de réplication de flux. PG_STAT_DATABASE: Fournit des statistiques de base de données, telles que la taille de la base de données, les temps de validation / recul des transactions et d'autres indicateurs clés. 2. Utilisez l'outil d'analyse de journaux pgbadg

Transformant du développement frontal au développement back-end, est-il plus prometteur d'apprendre Java ou Golang? Transformant du développement frontal au développement back-end, est-il plus prometteur d'apprendre Java ou Golang? Apr 02, 2025 am 09:12 AM

Chemin d'apprentissage du backend: le parcours d'exploration du front-end à l'arrière-end en tant que débutant back-end qui se transforme du développement frontal, vous avez déjà la base de Nodejs, ...

See all articles