python - Comment explorer les données des sites Web redirigés
怪我咯
怪我咯 2017-05-19 10:07:30
0
2
1022

Actuellement, j'apprends quelques connaissances sur les robots d'exploration et j'utilise le sélénium pour explorer certains sites Web complexes.
J'ai rencontré un problème. Le site Web du bon de travail que je dois explorer (je ne connais pas le mot de passe) doit d'abord se connecter à un système d'authentification, puis cliquer sur la connexion au système de bon de travail sur la page du système d'authentification, et il passera automatiquement au bon de travail sans se connecter. Un site Web à système unique, comment dois-je utiliser un robot pour explorer les données de ce système ?
Ce qui suit est le code HTML sur le système de bon de travail obtenu par Selenium, le système d'authentification

<a href="/link-test001" target="_blank" title="工单系统" rel="link-test001" data="1" datasrc="工单系统|||/files/link/test001.gif|||new|||/link-test001">
    <img src="/files/link/test001.gif" width="25" height="25" alt="工单系统" align="absmiddle"><span>工单系统</span>
</a>
怪我咯
怪我咯

走同样的路,发现不同的人生

répondre à tous(2)
漂亮男人

Utilisez Selenium ide, une extension Firefox, pour enregistrer l'opération.
Ensuite, exportez vers un fichier python.
Changez-le et exécutez-le.

Je vous propose de lire le livre écrit par le maître des insectes.

曾经蜡笔没有小新

Par exemple, si vous utilisez la bibliothèque de requêtes comme robot d'exploration, créez d'abord session(), A se connecte et B est la page vers laquelle accéder.

T=requests.session()
A=T.post(url=url,data=data)
B=T.get(url=url)

Le T créé représente le cookie stocké, qui sera conservé pour toujours

Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal