使用 Jsoup 解析网站信息
要将网页中的信息提取到 Java 程序中,您可以使用 HTML 解析器,例如杰汤。 Jsoup 脱颖而出,因为它采用类似 jQuery 的 CSS 选择器,并通过提取的数据简化迭代。
首先,在类路径中包含最新的 Jsoup JAR 文件。以下是如何扫描百思买商品页面并提取标题、价格和描述的示例:
<code class="java">import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.select.Elements; public class WebsiteScanner { public static void main(String[] args) throws Exception { String url = "https://www.bestbuy.com/site/sony-wh-1000xm5-wireless-bluetooth-noise-canceling-over-the-ear-headphones-black/6497835.p?skuId=6497835"; Document document = Jsoup.connect(url).get(); String title = document.select("h1.v-pdp-product-title").text(); String price = document.select(".v-pdp-price-amount").text(); String description = document.select(".v-pdp-main-description").text(); </code>
以上是如何使用 Jsoup 从 Java 网站中提取特定信息?的详细内容。更多信息请关注PHP中文网其他相关文章!