Dalam senario mengikis web, selalunya perlu untuk mencari elemen pada halaman web secara dinamik. Untuk mengatasi batasan BeautifulSoup dalam mengendalikan kandungan dinamik, Selenium boleh disepadukan untuk membolehkan menunggu elemen dimuatkan melalui JavaScript sebelum mengikis.
Pertimbangkan kod Python berikut:
element = WebDriverWait(driver, 100).until(EC.presence_of_element_located((By.class, "ng-binding ng-scope")))
Dalam ini baris kod, niatnya adalah untuk menentukan nama kelas untuk pengenalan elemen. Walau bagaimanapun, ralat boleh berlaku disebabkan kehadiran berbilang nama kelas dalam argumen By.class. Selenium tidak menyokong penghantaran berbilang nama kelas melalui By.class.
Untuk menangani isu ini, pertimbangkan cadangan berikut:
CSS_SELECTOR:
element = WebDriverWait(driver, 20).until(EC.visibility_of_element_located((By.CSS_SELECTOR, ".ng-binding.ng-scope#tabla_evolucion")))
XPATH:
element = WebDriverWait(driver, 20).until(EC.visibility_of_element_located((By.XPATH, "//*[@class='ng-binding ng-scope' and @id='tabla_evolucion']")))
Dengan memasukkan pengubahsuaian ini, anda boleh mengesan elemen pada halaman web yang dimuatkan secara dinamik melalui JavaScript dengan berkesan, membolehkan web berjaya mengikis.
Atas ialah kandungan terperinci Bagaimanakah Saya Boleh Mengesan Elemen Web dengan Pelbagai Nama Kelas Menggunakan Selenium dan Python dengan Cekap?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!