> Java > java지도 시간 > 본문

Java에서 특정 클래스 이름을 사용하여 HTML DIV 태그에서 데이터를 효율적으로 추출하는 방법은 무엇입니까?

Susan Sarandon
풀어 주다: 2024-10-24 17:03:02
원래의
272명이 탐색했습니다.

How to Efficiently Extract Data from HTML DIV Tags with a Specific Class Name in Java?

Java HTML 구문 분석

웹 스크래핑 애플리케이션으로 작업할 때 HTML 페이지에서 데이터를 효과적으로 추출하는 것이 필요해집니다. 이 시나리오의 작업은 주어진 CSS 클래스 이름을 가진 특정 DIV 태그에서 데이터를 얻는 것입니다. HTML의 각 줄에서 클래스 이름을 검색하는 현재 접근 방식은 기능적이지만 최적이 아닐 수 있습니다.

대안으로 Jsoup

Jsoup 사용을 고려하세요. HTML 처리를 위한 라이브러리. Jsoup은 잘못된 HTML을 처리하도록 설계되었으며 jQuery와 유사한 태그 선택기를 사용하여 Java에서 HTML을 구문 분석하기 위한 편리한 구문을 제공합니다.

Jsoup 사용

Jsoup을 사용하려면 다음을 따르세요. 단계:

  1. Jsoup 라이브러리를 프로젝트로 가져옵니다.
  2. HTML 소스 코드에서 Jsoup 문서 개체를 만듭니다.
  3. select 메서드를 사용하여 DIV를 찾습니다. 지정된 CSS 클래스 이름이 있는 태그.
  4. text()와 같은 메소드를 사용하여 텍스트 콘텐츠를 얻거나 attr("href")와 같은 메소드를 사용하여 링크 URL을 검색하여 추출된 데이터에 액세스합니다.

예:

<code class="java">import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.select.Elements;

Document doc = Jsoup.parse(html);
Elements divs = doc.select("div.classname");

for (Element div : divs) {
    if (div.hasClass("classname")) {
        System.out.println("Text: " + div.text());
        System.out.println("Link: " + div.attr("href"));
    }
}</code>
로그인 후 복사

위 내용은 Java에서 특정 클래스 이름을 사용하여 HTML DIV 태그에서 데이터를 효율적으로 추출하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿
회사 소개 부인 성명 Sitemap
PHP 중국어 웹사이트:공공복지 온라인 PHP 교육,PHP 학습자의 빠른 성장을 도와주세요!