Mon travail nécessite d'explorer des informations sur Amazon, mais l'anti-crawler d'Amazon est trop puissant et la même adresse IP sera bloquée.
Version Python : 3.6, IDE : Pycharm 2017.1
J'ai vérifié beaucoup d'informations sur Internet et lu le manuel de la bibliothèque de requêtes, mais ce sont toutes la même méthode. Le code est le suivant :
import requests
'''代理IP地址(高匿)'''
proxy = {'HTTPS': '117.85.105.170:808'}
'''head 信息'''
head = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.102 Safari/537.36',
'Connection': 'keep-alive'}
'''http://icanhazip.com会返回当前的IP地址'''
p = requests.get('http://icanhazip.com', headers=head, proxies=proxy)
print(p.text)
Selon la théorie de nombreux tutoriels que j'ai lus, si le proxy est configuré avec succès, la dernière IP affichée devrait être l'adresse IP du proxy, mais au final c'est toujours ma véritable adresse IP. que le proxy n'est pas défini ?
Les proxys utilisent les paramètres http lorsque vous accédez à http et les paramètres https lorsque vous accédez à https
Votre proxy doit donc contenir à la fois les configurations http et https pour qu'il prenne effet