Jsoup を使用した Web サイトの情報の解析
Web ページから情報を Java プログラムに抽出するには、次のような HTML パーサーを利用できます。ジースープ。 Jsoup は、jQuery のような CSS セレクターを採用し、抽出されたデータの反復処理を簡素化する点で際立っています。
まず、最新の Jsoup JAR ファイルをクラスパスに含めます。 Best Buy の商品ページをスキャンして、タイトル、価格、説明を抽出する方法の例を次に示します:
<code class="java">import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.select.Elements; public class WebsiteScanner { public static void main(String[] args) throws Exception { String url = "https://www.bestbuy.com/site/sony-wh-1000xm5-wireless-bluetooth-noise-canceling-over-the-ear-headphones-black/6497835.p?skuId=6497835"; Document document = Jsoup.connect(url).get(); String title = document.select("h1.v-pdp-product-title").text(); String price = document.select(".v-pdp-price-amount").text(); String description = document.select(".v-pdp-main-description").text(); </code>
以上がJava で Jsoup を使用して Web サイトから特定の情報を抽出するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。