Java HTML 구문 분석
웹 스크래핑 애플리케이션으로 작업할 때 HTML 페이지에서 데이터를 효과적으로 추출하는 것이 필요해집니다. 이 시나리오의 작업은 주어진 CSS 클래스 이름을 가진 특정 DIV 태그에서 데이터를 얻는 것입니다. HTML의 각 줄에서 클래스 이름을 검색하는 현재 접근 방식은 기능적이지만 최적이 아닐 수 있습니다.
대안으로 Jsoup
Jsoup 사용을 고려하세요. HTML 처리를 위한 라이브러리. Jsoup은 잘못된 HTML을 처리하도록 설계되었으며 jQuery와 유사한 태그 선택기를 사용하여 Java에서 HTML을 구문 분석하기 위한 편리한 구문을 제공합니다.
Jsoup 사용
Jsoup을 사용하려면 다음을 따르세요. 단계:
예:
<code class="java">import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.select.Elements; Document doc = Jsoup.parse(html); Elements divs = doc.select("div.classname"); for (Element div : divs) { if (div.hasClass("classname")) { System.out.println("Text: " + div.text()); System.out.println("Link: " + div.attr("href")); } }</code>
위 내용은 Java에서 특정 클래스 이름을 사용하여 HTML DIV 태그에서 데이터를 효율적으로 추출하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!