Java プログラムの Web ページ データ抽出
Web ページから Java プログラムに情報を抽出するには、Web スクレイピングと呼ばれる特定の技術が必要です。 Web スクレイピングには、HTML コンテンツを解析して対象のデータを識別して抽出することが含まれます。
強く推奨されるアプローチの 1 つは、jQuery のような CSS セレクターのサポートで知られ、ループ互換性が強化された Jsoup HTML パーサーを利用することです。 Web スクレイピング プロセスを示すサンプル Java コードを次に示します:
<code class="java">import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element; import org.jsoup.select.Elements; public class WebScraper { public static void main(String[] args) throws Exception { // Target URL String url = "https://www.bestbuy.com/site/best-buy-insignia-55-class-f30-series-led-4k-uhd-smart-fire-tv/6494164.p?skuId=6494164"; // Connect to the URL and parse HTML content Document document = Jsoup.connect(url).get(); // Get product information using CSS selectors String title = document.select("h1.page-title").text(); String price = document.select(".priceView-customer-price").text(); String description = document.select(".product-lang-en-us .product-description-rich-html").text(); // Print results</code>
以上がJsoup を使用して Web ページ データを Java プログラムに抽出する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。