1. 解析方法
(1) 文字列からの解析
String html = "
";
Document doc = Jsoup.parse(html);
?
(2) from URL取得と解析
Document doc = Jsoup.connect("http://example.com/").get();
String title = doc.title();
Document doc = Jsoup.connect(" http://example.com") .data("query", "Java").userAgent("Mozilla").cookie("auth", "token").timeout(3000).post();
2. DOM 内の要素の走査 (1) 要素の検索
getElementById(文字列 ID)
getElementByTag(文字列タグ)
getElementByClass(文字列クラス名)
getElementByAttribute(文字列キー)
siblingElements()、firstElementSibling()、lastElementSibling()、nextElementSibling()、previousElementSibling()
(2) 要素データの取得
attr(String key) ? キー属性の取得
attributes() 属性の取得
id(), className(), classNames ? ()
text() ? テキストコンテンツを取得します
html() ? この要素を含む HTML コンテンツを取得します
data() ? ;srcipt> または