Analyse einer Website nach Informationen mit Jsoup
Um Informationen aus einer Webseite in Ihr Java-Programm zu extrahieren, können Sie HTML-Parser wie verwenden Jsuppe. Jsoup zeichnet sich dadurch aus, dass es jQuery-ähnliche CSS-Selektoren verwendet und die Iteration durch extrahierte Daten vereinfacht.
Fügen Sie zunächst die neueste Jsoup-JAR-Datei in Ihren Klassenpfad ein. Hier ist ein Beispiel dafür, wie man eine Best Buy-Artikelseite scannt und Titel, Preis und Beschreibung extrahiert:
<code class="java">import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.select.Elements; public class WebsiteScanner { public static void main(String[] args) throws Exception { String url = "https://www.bestbuy.com/site/sony-wh-1000xm5-wireless-bluetooth-noise-canceling-over-the-ear-headphones-black/6497835.p?skuId=6497835"; Document document = Jsoup.connect(url).get(); String title = document.select("h1.v-pdp-product-title").text(); String price = document.select(".v-pdp-price-amount").text(); String description = document.select(".v-pdp-main-description").text(); </code>
Das obige ist der detaillierte Inhalt vonWie kann ich Jsoup verwenden, um bestimmte Informationen von einer Website in Java zu extrahieren?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!