golangクエリhtml

May 19, 2023 am 10:46 AM

まえがき

プログラミング言語の発展は、私たちに無限の可能性をもたらしました。最新のプログラミング言語である Go 言語は、効率性、シンプルさ、クロスプラットフォームなどの多くの利点を備えており、サーバーサイド プログラミング、クラウド コンピューティング、コンテナーなどの分野で広く使用されています。この記事では、サードパーティのライブラリを使用して Go で HTML ドキュメントをクエリする方法を紹介します。

1. Go 言語と HTML

HTML は、Web ページの構築に使用されるマークアップ言語です。要素の構造とスタイルを指定し、CSS や JavaScript などの他のテクノロジとともに使用して、複雑なインタラクティブな効果を実現できます。 Go 言語は、コンパイルされ、静的に型指定され、同時実行安全なプログラミング言語であり、その効率性で知られています。 Go 言語自体は HTML 解析を直接サポートしていませんが、サードパーティのライブラリを使用することでこのタスクを実行できます。

2. Go 言語での HTML 解析

Go 言語では、golang.org/x/net/html# などのさまざまなツールを使用して HTML ドキュメントを解析できます。 ##、github.com/PuerkitoBio/goquery など。これらのツールは、HTML ドキュメントの解析、走査、および変更のための一連のメソッドと構造を提供します。

2.1

golang.org/x/net/html

golang.org/x/net/html を使用します。これは Go 言語によって提供されます。 HTML ドキュメントを解析するための豊富な API を提供する標準ライブラリ。次に、ライブラリを使用して HTML ドキュメント内のノード データをクエリする方法を示します。

以下は単純な HTML ドキュメントです:

<!DOCTYPE html>
<html>
  <head>
    <title>A Simple HTML Document</title>
  </head>
  <body>
    <h1>This is a heading</h1>
    <p>This is a paragraph.</p>
    <p>This is another paragraph.</p>
  </body>
</html>
ログイン後にコピー
ログイン後にコピー

次に、このドキュメント内のすべての段落ノード (

タグ) のテキスト コンテンツをクエリしたいとします。まず、HTML ドキュメントを DOM ツリー構造に解析し、DOM ツリーを再帰的に走査してノード データをクエリする必要があります。

package main

import (
    "fmt"
    "golang.org/x/net/html"
    "strings"
)

var htmlString = `
<!DOCTYPE html>
<html>
  <head>
    <title>A Simple HTML Document</title>
  </head>
  <body>
    <h1>This is a heading</h1>
    <p>This is a paragraph.</p>
    <p>This is another paragraph.</p>
  </body>
</html>
`

func main() {
    reader := strings.NewReader(htmlString)
    doc, err := html.Parse(reader)
    if err != nil {
        fmt.Println("Failed to parse HTML string:", err)
        return
    }
    var find func(*html.Node)
    find = func(n *html.Node) {
        if n.Type == html.ElementNode && n.Data == "p" {
            fmt.Println(n.FirstChild.Data)
        } else {
            for c := n.FirstChild; c != nil; c = c.NextSibling {
                find(c)
            }
        }
    }
    find(doc)
}
ログイン後にコピー

上記のコードでは、

strings.NewReader() を使用して文字列を io.Reader インターフェイス型に変換し、それを html.Parse() HTML文書を解析する関数。次に、find() という名前の再帰関数を定義して、DOM ツリーを走査し、条件を満たすノードを見つけます。段落ノードが見つかると、そのノードのテキスト コンテンツが出力されます。最後に、find() 関数を呼び出して、すべての段落ノードのテキスト コンテンツをクエリして出力します。

2.2

github.com/PuerkitoBio/goquery

github.com/PuerkitoBio/goquery は非常に人気のある Go 言語ライブラリです。 HTML の解析とクエリを実行するためのシンプルで便利な方法です。 goquery を使用すると、DOM ツリーの構造を深く掘り下げることなく、HTML ドキュメントを走査してクエリを実行できます。

以下はサンプル HTML ドキュメントです:

<!DOCTYPE html>
<html>
  <head>
    <title>A Simple HTML Document</title>
  </head>
  <body>
    <h1>This is a heading</h1>
    <p>This is a paragraph.</p>
    <p>This is another paragraph.</p>
  </body>
</html>
ログイン後にコピー
ログイン後にコピー

次に、ドキュメント内のすべての段落ノードのテキスト コンテンツをクエリしたいと思います。これは、

goquery を使用すると簡単に実現できます。 :

package main

import (
    "fmt"
    "github.com/PuerkitoBio/goquery"
    "strings"
)

var htmlString = `
<!DOCTYPE html>
<html>
  <head>
    <title>A Simple HTML Document</title>
  </head>
  <body>
    <h1>This is a heading</h1>
    <p>This is a paragraph.</p>
    <p>This is another paragraph.</p>
  </body>
</html>
`

func main() {
    reader := strings.NewReader(htmlString)
    doc, err := goquery.NewDocumentFromReader(reader)
    if err != nil {
        fmt.Println("Failed to parse HTML string:", err)
        return
    }
    doc.Find("p").Each(func(i int, s *goquery.Selection) {
        fmt.Println(s.Text())
    })
}
ログイン後にコピー

上記のコードでは、

strings.NewReader() を使用して文字列を io.Reader インターフェイス型に変換し、それを goquery.NewDocumentFromReader() に渡します。 HTML ドキュメントを解析する 関数。次に、doc.Find("p") を使用してすべての段落ノードをクエリし、s.Text() メソッドを通じてそのテキスト コンテンツを出力します。

3. 概要

この記事では、Go 言語で HTML ドキュメントのコンテンツをクエリする方法を紹介します。

golang.org/x/net/htmlgithub.com/PuerkitoBio/goquery を使用した 2 つの異なるアプローチを検討しました。これらのツールは、HTML ドキュメントを解析できるだけでなく、DOM ツリーを走査して操作するための豊富な API も提供します。どの方法を選択しても、HTML ドキュメントからデータを簡単に取得できるため、よりエレガントで効率的なアプリケーションを構築できます。

以上がgolangクエリhtmlの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

Debian OpenSSLの脆弱性は何ですか Debian OpenSSLの脆弱性は何ですか Apr 02, 2025 am 07:30 AM

OpenSSLは、安全な通信で広く使用されているオープンソースライブラリとして、暗号化アルゴリズム、キー、証明書管理機能を提供します。ただし、その歴史的バージョンにはいくつかの既知のセキュリティの脆弱性があり、その一部は非常に有害です。この記事では、Debian SystemsのOpenSSLの共通の脆弱性と対応測定に焦点を当てます。 Debianopensslの既知の脆弱性:OpenSSLは、次のようないくつかの深刻な脆弱性を経験しています。攻撃者は、この脆弱性を、暗号化キーなどを含む、サーバー上の不正な読み取りの敏感な情報に使用できます。

PPROFツールを使用してGOパフォーマンスを分析しますか? PPROFツールを使用してGOパフォーマンスを分析しますか? Mar 21, 2025 pm 06:37 PM

この記事では、プロファイリングの有効化、データの収集、CPUやメモリの問題などの一般的なボトルネックの識別など、GOパフォーマンスを分析するためにPPROFツールを使用する方法について説明します。

Goでユニットテストをどのように書きますか? Goでユニットテストをどのように書きますか? Mar 21, 2025 pm 06:34 PM

この記事では、GOでユニットテストを書くことで、ベストプラクティス、モッキングテクニック、効率的なテスト管理のためのツールについて説明します。

Go's Crawler Collyのキュースレッドの問題は何ですか? Go's Crawler Collyのキュースレッドの問題は何ですか? Apr 02, 2025 pm 02:09 PM

Go Crawler Collyのキュースレッドの問題は、Go言語でColly Crawler Libraryを使用する問題を調査します。 �...

GOの浮動小数点番号操作に使用されるライブラリは何ですか? GOの浮動小数点番号操作に使用されるライブラリは何ですか? Apr 02, 2025 pm 02:06 PM

GO言語の浮動小数点数操作に使用されるライブラリは、精度を確保する方法を紹介します...

Go FMTコマンドとは何ですか?なぜそれが重要なのですか? Go FMTコマンドとは何ですか?なぜそれが重要なのですか? Mar 20, 2025 pm 04:21 PM

この記事では、GOプログラミングのGo FMTコマンドについて説明します。これは、公式スタイルのガイドラインに準拠するためのコードをフォーマットします。コードの一貫性、読みやすさ、およびスタイルの議論を削減するためのGO FMTの重要性を強調しています。 Best Practices fo

Debianの下のPostgreSQL監視方法 Debianの下のPostgreSQL監視方法 Apr 02, 2025 am 07:27 AM

この記事では、Debianシステムの下でPostgreSQLデータベースを監視するためのさまざまな方法とツールを紹介し、データベースのパフォーマンス監視を完全に把握するのに役立ちます。 1. PostgreSQLを使用して監視を監視す​​るビューPostgreSQL自体は、データベースアクティビティを監視するための複数のビューを提供します。 PG_STAT_REPLICATION:特にストリームレプリケーションクラスターに適した複製ステータスを監視します。 PG_STAT_DATABASE:データベースサイズ、トランザクションコミット/ロールバック時間、その他のキーインジケーターなどのデータベース統計を提供します。 2。ログ分析ツールPGBADGを使用します

フロントエンドからバックエンドの開発に変身すると、JavaやGolangを学ぶことはより有望ですか? フロントエンドからバックエンドの開発に変身すると、JavaやGolangを学ぶことはより有望ですか? Apr 02, 2025 am 09:12 AM

バックエンド学習パス:フロントエンドからバックエンドへの探査の旅は、フロントエンド開発から変わるバックエンド初心者として、すでにNodeJSの基盤を持っています...

See all articles