Rumah > Java > javaTutorial > teks badan

Bagaimana untuk Mengekstrak Data dengan Cekap dari Tag DIV HTML dengan Nama Kelas Tertentu dalam Java?

Susan Sarandon
Lepaskan: 2024-10-24 17:03:02
asal
272 orang telah melayarinya

How to Efficiently Extract Data from HTML DIV Tags with a Specific Class Name in Java?

Penghuraian HTML Java

Apabila bekerja dengan aplikasi mengikis web, adalah perlu untuk mengekstrak data secara berkesan daripada halaman HTML. Dalam senario ini, tugasnya adalah untuk mendapatkan data daripada tag DIV tertentu dengan nama kelas CSS yang diberikan. Walaupun pendekatan semasa mencari nama kelas dalam setiap baris HTML berfungsi, ia mungkin tidak optimum.

Jsoup sebagai Alternatif

Pertimbangkan untuk menggunakan Jsoup perpustakaan untuk pemprosesan HTML. Jsoup direka bentuk untuk mengendalikan HTML yang cacat dan menyediakan sintaks yang mudah untuk menghuraikan HTML dalam Java menggunakan pemilih teg seperti jQuery.

Menggunakan Jsoup

Untuk menggunakan Jsoup, ikuti ini langkah:

  1. Import perpustakaan Jsoup ke dalam projek anda.
  2. Buat objek dokumen Jsoup daripada kod sumber HTML.
  3. Gunakan kaedah pilih untuk mencari DIV teg dengan nama kelas CSS yang ditentukan.
  4. Akses data yang diekstrak menggunakan kaedah seperti text() untuk mendapatkan kandungan teks atau attr("href") untuk mendapatkan semula URL pautan.

Contohnya:

<code class="java">import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.select.Elements;

Document doc = Jsoup.parse(html);
Elements divs = doc.select("div.classname");

for (Element div : divs) {
    if (div.hasClass("classname")) {
        System.out.println("Text: " + div.text());
        System.out.println("Link: " + div.attr("href"));
    }
}</code>
Salin selepas log masuk

Atas ialah kandungan terperinci Bagaimana untuk Mengekstrak Data dengan Cekap dari Tag DIV HTML dengan Nama Kelas Tertentu dalam Java?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:php.cn
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Artikel terbaru oleh pengarang
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan
Tentang kita Penafian Sitemap
Laman web PHP Cina:Latihan PHP dalam talian kebajikan awam,Bantu pelajar PHP berkembang dengan cepat!