Jsoup을 사용하여 웹사이트 정보 구문 분석
웹 페이지에서 정보를 Java 프로그램으로 추출하려면 다음과 같은 HTML 구문 분석기를 활용할 수 있습니다. Jsoup. Jsoup은 jQuery와 유사한 CSS 선택기를 사용하고 추출된 데이터를 통해 반복을 단순화한다는 점에서 두각을 나타냅니다.
시작하려면 클래스 경로에 최신 Jsoup JAR 파일을 포함하세요. 다음은 Best Buy 항목 페이지를 스캔하고 제목, 가격 및 설명을 추출하는 방법의 예입니다.
<code class="java">import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.select.Elements; public class WebsiteScanner { public static void main(String[] args) throws Exception { String url = "https://www.bestbuy.com/site/sony-wh-1000xm5-wireless-bluetooth-noise-canceling-over-the-ear-headphones-black/6497835.p?skuId=6497835"; Document document = Jsoup.connect(url).get(); String title = document.select("h1.v-pdp-product-title").text(); String price = document.select(".v-pdp-price-amount").text(); String description = document.select(".v-pdp-main-description").text(); </code>
위 내용은 Jsoup을 사용하여 Java 웹사이트에서 특정 정보를 추출하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!