Java の HTML ドキュメントの解析と走査 tool_html/css_WEB-ITnose-htmlチュートリアル-php.cn

ホームページ

ウェブフロントエンド

htmlチュートリアル

Java の HTML ドキュメントの解析と走査 tool_html/css_WEB-ITnose

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 24, 2016 am 11:20 AM

まえがき: ほとんどすべての言語で HTML ハイパーテキストを解析および走査できます。私がよく使用する言語は php ですが、Android クライアントでネットワーク http データを取得したいと考えています。php は使用できますが、セカンダリ接続と PHP 環境が必要です。しかし、それを行うには Java 言語を使用するだけで、Java ネイティブ言語を直接使用してコーディングすることは不可能です。解析には Jsoup を使用します。Jsoup は Java 言語で HTML ドキュメントを解析するための優れたツールです。

Jsoup の概要Jsoup は、HTML を解析し、Java 言語でドキュメントを走査するための優れたツールです。

Jsoup の利点 そのパーサーは、HTML 形式が完全かどうかに関係なく、提供された HTML ドキュメントからクリーンな解析結果を作成するために最善を尽くします。たとえば、以下を処理できます:

没有关闭的标签  <p>Lorem <p>Ipsum parses to <p>Lorem</p> <p>Ipsum</p>

ログイン後にコピー

隐式标签  <td>Table data</td>包装成<table><tr><td>

ログイン後にコピー

创建可靠的文档结构（html标签包含head 和 body，在head只出现恰当的元素）

ログイン後にコピー

一般的な Jsoup メソッド URL からドキュメントをロードする

简单的get方法Document doc = Jsoup.connect("http://www.domain.com/").get();String title = doc.title();

ログイン後にコピー

带头信息的post方法Document doc = Jsoup.connect("http://www..domain.com")                    .data("username", "Alic")                    .userAgent("Mozilla")                    .cookie("auth", "token")                    .timeout(3000)                    .post();

ログイン後にコピー

ファイルから HTML ドキュメントをロードする

File file = new File("path");Document doc = Jsoup.parse(file, "UTF-8", "http://www.domian.com/");

ログイン後にコピー

文字列から HTML をロードするだけ

Document doc = Jsoup.parse(String html);

ログイン後にコピー

ドムドキュメントをトラバースするメソッド

File file = new File("/path/index.html");Document doc = Jsoup.parse(file, "UTF-8", "http://www.domian.com/");Element content = doc.getElementById("content");//获取id为content的dom节点Elements links = content.getElementsByTag("a");//获取所有的a标签dom节点//遍历所有的a标签for (Element link : links) {        String linkHref = link.attr("href");        String linkText = link.text();}Elements links = doc.select("a[href]"); //带有href属性的a元素Elements pngs = doc.select("img[src$=.png]");  //扩展名为.png的图片Element masthead = doc.select("div.masthead").first();  //class等于masthead的div标签Elements resultLinks = doc.select("h3.r > a"); //在h3元素之后的a元素

ログイン後にコピー

よく使用されるメソッド: Jsoup を転送するには、公式 Web サイトの API ドキュメントを参照してください

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

神レベルのコード編集ソフト（SublimeText3）

ホットトピック

Gmailメールのログイン入り口はどこですか？

7807

Java チュートリアル

1646

CakePHP チュートリアル

1402

Laravel チュートリアル

1300

PHP チュートリアル

1236

Related knowledge

HTMLは初心者のために簡単に学ぶことができますか？ Apr 07, 2025 am 12:11 AM

HTMLは、簡単に学習しやすく、結果をすばやく見ることができるため、初心者に適しています。 1）HTMLの学習曲線はスムーズで簡単に開始できます。 2）基本タグをマスターして、Webページの作成を開始します。 3）柔軟性が高く、CSSおよびJavaScriptと組み合わせて使用できます。 4）豊富な学習リソースと最新のツールは、学習プロセスをサポートしています。

HTML、CSS、およびJavaScriptの役割：コアの責任 Apr 08, 2025 pm 07:05 PM

HTMLはWeb構造を定義し、CSSはスタイルとレイアウトを担当し、JavaScriptは動的な相互作用を提供します。 3人はWeb開発で職務を遂行し、共同でカラフルなWebサイトを構築します。

HTML、CSS、およびJavaScriptの理解：初心者向けガイド Apr 12, 2025 am 12:02 AM

webdevelopmentReliesOnhtml、css、andjavascript：1）htmlStructuresContent、2）cssStylesit、および3）Javascriptaddsinteractivity、形成、

HTMLでの開始タグの例は何ですか？ Apr 06, 2025 am 12:04 AM

Anexampleapalofastartingtaginhtmlis、それはaperginsaparagraph.startingtagsaresentionentientiontheyinitiateelements、definetheirtypes、およびarecrucialforurturingwebpagesandcontingthomedomを構築します。