La technologie des robots d'exploration peut-elle explorer https ?
Tout d'abord, comprenons ce qu'est https
https est HTTP+SSL L'abréviation de HTTP signifie crypter et transmettre le texte brut précédent sur la base de la méthode de transmission HTTP. La méthode de cryptage des informations et la clé secrète seront déterminées avant la transmission. Même si elles sont capturées ou falsifiées pendant la transmission, cela peut garantir que les informations le seront. ne soit pas divulgué.
Le robot d'exploration se déguise essentiellement en navigateur, envoie une requête au serveur et participe à l'ensemble du processus, de sorte que même les liens https peuvent être explorés, mais uniquement si le faux client possède le bon certificat SSL.
Trouvez la cause première de l'erreur
Si une erreur SSL s'affiche lors de l'exécution du robot d'exploration, c'est généralement parce que le certificat local ou la bibliothèque SSL associée n'est pas installé correctement et que le serveur utilise son propre certificat CA, qui n'est pas certifié par une organisation faisant autorité
Résolution des problèmes d'exception de certificat
Pour le problème du certificat CCC, nous pouvons nous référer aux solutions centralisées suivantes. :
1. Ne vérifiez pas le certificat CCC, mais ignorez l'avertissement de sécurité
coding=utf-8import requests# 不验证CA证书则需要忽略安全警告方式一:import urllib3urllib3.disable_warnings()方式二:from requests.packages.urllib3.exceptions import InsecureRequestWarningrequests.packages.urllib3.disable_warnings(InsecureRequestWarning)r=requests.get(url=“https://www.baidu.com/”,verify=False)print r.elapsed.total_seconds()
2 Précisez l'emplacement du certificat ou le dossier contenant le certificat (ce dossier est créé par l'outil OpenSSL)<. 🎜>
coding=utf-8import requestsr=requests.get(url=“https://www.baidu.com/”,verify='/path/to/certfile')
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!