Mendapatkan semula Kandungan Dijana JavaScript dengan Jsoup
Dalam situasi ini, anda menghadapi cabaran biasa apabila menggunakan Jsoup untuk menghuraikan halaman web: ketidakupayaan untuk mendapatkan semula kandungan yang dijana secara dinamik oleh JavaScript selepas halaman dimuatkan.
Jsoup direka bentuk terutamanya sebagai penghurai HTML, yang bermaksud ia hanya beroperasi pada struktur HTML statik halaman web kerana ia wujud pada masa penghuraian. Tidak seperti penyemak imbas web, ia tidak mempunyai keupayaan untuk melaksanakan JavaScript dan menangkap perubahan DOM yang terhasil.
Kandungan yang anda cari - teks dalam elemen
Penyelesaian:
Untuk mengatasi had ini, anda perlu menggunakan komponen penyemak imbas terbenam yang boleh membuat dan melaksanakan JavaScript, menjadikan kandungan yang dijana tersedia untuk dihuraikan. Terdapat beberapa pustaka Java yang tersedia untuk tujuan ini, seperti:
Setelah anda menyepadukan komponen penyemak imbas terbenam ke dalam aplikasi Java anda, anda boleh menghuraikan halaman dengan WebDriver, Selenium atau JWebUnit, cari elemen
Atas ialah kandungan terperinci Bagaimanakah Saya Boleh Dapatkan Kandungan Dijana JavaScript Menggunakan Jsoup?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!