Pada masa ini saya sedang mempelajari sedikit pengetahuan tentang perangkak dan menggunakan selenium untuk merangkak beberapa tapak web yang kompleks.
Saya menghadapi masalah Tapak web pesanan kerja yang perlu saya crawl (saya tidak tahu kata laluan) perlu log masuk ke sistem pengesahan dahulu, dan kemudian klik pada sambungan sistem pesanan kerja pada halaman sistem pengesahan, dan ia akan secara automatik melompat ke perintah kerja tanpa log masuk. Satu tapak web sistem, bagaimanakah saya harus menggunakan perangkak untuk merangkak data sistem ini?
Berikut ialah html tentang sistem pesanan kerja yang diperolehi oleh selenium, sistem pengesahan
<a href="/link-test001" target="_blank" title="工单系统" rel="link-test001" data="1" datasrc="工单系统|||/files/link/test001.gif|||new|||/link-test001">
<img src="/files/link/test001.gif" width="25" height="25" alt="工单系统" align="absmiddle"><span>工单系统</span>
</a>
Gunakan ide selenium, sambungan firefox, untuk merekodkan operasi.
Kemudian eksport ke fail python.
Hanya tukar dan jalankan.
Saya cadangkan anda membaca buku yang ditulis oleh tuan serangga.
Sebagai contoh, jika anda menggunakan pustaka permintaan sebagai perangkak, buat session() dahulu, A log masuk dan B ialah halaman untuk melompat ke.
T yang dicipta mewakili kuki yang disimpan, yang akan disimpan selama-lamanya