python - Cara merangkak data dari tapak web yang diubah hala
怪我咯
怪我咯 2017-05-19 10:07:30
0
2
1047

Pada masa ini saya sedang mempelajari sedikit pengetahuan tentang perangkak dan menggunakan selenium untuk merangkak beberapa tapak web yang kompleks.
Saya menghadapi masalah Tapak web pesanan kerja yang perlu saya crawl (saya tidak tahu kata laluan) perlu log masuk ke sistem pengesahan dahulu, dan kemudian klik pada sambungan sistem pesanan kerja pada halaman sistem pengesahan, dan ia akan secara automatik melompat ke perintah kerja tanpa log masuk. Satu tapak web sistem, bagaimanakah saya harus menggunakan perangkak untuk merangkak data sistem ini?
Berikut ialah html tentang sistem pesanan kerja yang diperolehi oleh selenium, sistem pengesahan

<a href="/link-test001" target="_blank" title="工单系统" rel="link-test001" data="1" datasrc="工单系统|||/files/link/test001.gif|||new|||/link-test001">
    <img src="/files/link/test001.gif" width="25" height="25" alt="工单系统" align="absmiddle"><span>工单系统</span>
</a>
怪我咯
怪我咯

走同样的路,发现不同的人生

membalas semua(2)
漂亮男人

Gunakan ide selenium, sambungan firefox, untuk merekodkan operasi.
Kemudian eksport ke fail python.
Hanya tukar dan jalankan.

Saya cadangkan anda membaca buku yang ditulis oleh tuan serangga.

曾经蜡笔没有小新

Sebagai contoh, jika anda menggunakan pustaka permintaan sebagai perangkak, buat session() dahulu, A log masuk dan B ialah halaman untuk melompat ke.

T=requests.session()
A=T.post(url=url,data=data)
B=T.get(url=url)

T yang dicipta mewakili kuki yang disimpan, yang akan disimpan selama-lamanya

Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan