Analyse d'informations sur un site Web avec Jsoup
Pour extraire des informations d'une page Web dans votre programme Java, vous pouvez utiliser des analyseurs HTML tels que Jsoup. Jsoup se distingue car il utilise des sélecteurs CSS de type jQuery et simplifie l'itération à travers les données extraites.
Pour commencer, incluez le dernier fichier Jsoup JAR dans votre chemin de classe. Voici un exemple de la façon de numériser la page d'un article Best Buy et d'en extraire le titre, le prix et la description :
<code class="java">import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.select.Elements; public class WebsiteScanner { public static void main(String[] args) throws Exception { String url = "https://www.bestbuy.com/site/sony-wh-1000xm5-wireless-bluetooth-noise-canceling-over-the-ear-headphones-black/6497835.p?skuId=6497835"; Document document = Jsoup.connect(url).get(); String title = document.select("h1.v-pdp-product-title").text(); String price = document.select(".v-pdp-price-amount").text(); String description = document.select(".v-pdp-main-description").text(); </code>
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!