jsoup: HTML_html/css_WEB-ITnose の解析の使用法の概要

WBOY
リリース: 2016-06-24 11:42:42
オリジナル
1488 人が閲覧しました

1. 解析方法

(1) 文字列からの解析

String html = "最初の解析";

Document doc = Jsoup.parse(html);

?

(2) from URL取得と解析

Document doc = Jsoup.connect("http://example.com/").get();

String title = doc.title();

Document doc = Jsoup.connect(" http://example.com") .data("query", "Java").userAgent("Mozilla").cookie("auth", "token").timeout(3000).post();

... parse(input, "UTF-8", "http://example.com/");

2. DOM 内の要素の走査 (1) 要素の検索

getElementById(文字列 ID)

getElementByTag(文字列タグ)

getElementByClass(文字列クラス名)

getElementByAttribute(文字列キー)

siblingElements()、firstElementSibling()、lastElementSibling()、nextElementSibling()、previousElementSibling()

parent( ) ,children(),child(intindex)


(2) 要素データの取得

attr(String key) ? キー属性の取得

attributes() 属性の取得

id(), className(), classNames ? ()

text() ? テキストコンテンツを取得します

html() ? この要素を含む HTML コンテンツを取得します

data() ? ;srcipt> または