Bagaimana untuk mengikis data daripada tapak web berikut untuk mencari butiran kes tertentu?
Berikut adalah langkah manual untuk mencari butiran kes:
- Navigasi ke https://www.claytoncountyga.gov/government/courts/court-case-inquiry/
- Nampaknya mungkin terdapat borang pemuatan JavaScript dengan butang/input yang membolehkan anda menelusuri butiran kes lanjut - "Carian Nama" perlu dipilih untuk mencari kes mengikut nama keluarga - klik padanya
- Skrin baharu kemudian muncul dalam elemen yang sama iaitu (2), membenarkan pengguna memilih daripada mahkamah lungsur (mis. Mahkamah Majistret) dan memasukkan nama pertama dan terakhir (Smith John) melalui input teks bentuk bebas.
- Klik "Serah" untuk melihat semua kes
- Lihat butiran kes dengan mengklik pada nombor kes pada salah satu baris dalam jadual yang diisikan dalam elemen yang sama seperti dalam semua langkah sebelumnya - Saya ingin mengikis data dari halaman ini.
Oleh kerana bentuk dalaman nampaknya dirangkumkan (saya rasa dilaksanakan dalam Javascript), saya tidak dapat melihat elemen HTML yang diberikan selepas setiap input disediakan. Bagaimanakah saya mengautomasikan menggunakan Python?
Borang tersebut terkandung dalam kaedah
iframe
内。为了使 selenium 能够与其中的元素交互,我们首先必须使用EC.frame_to_be_available_and_switch_to_it
dengan ID "Kaunti Clayton" untuk beralih kepadanya.Kemudian menggunakan
Select()
kita boleh memilih pilihan daripada menu lungsur.Di halaman terakhir, kami mendapat semua url nombor kes dan menyimpannya dalam
case_numbers_urls
supaya kami boleh mengulanginya, memuatkan setiap kes, mendapatkan maklumat dan menyampaikannya ke kes seterusnya.