Comment définir les en-têtes de requête pour le robot d'exploration Python

爱喝马黛茶的安东尼
Libérer: 2019-06-20 14:30:38
original
2827 Les gens l'ont consulté

Lors de la demande d'exploration du Web, des mots tels que « Désolé, accès impossible » apparaîtront dans les informations textuelles de sortie. Cela signifie que l'exploration est interdite et que le mécanisme anti-exploration doit être utilisé pour résoudre ce problème.

Les en-têtes sont l'un des moyens de résoudre le problème de l'anti-exploration des requêtes. Cela équivaut à entrer dans le serveur lui-même de cette page Web et à prétendre qu'il explore des données.

Pour les pages Web anti-crawler, vous pouvez définir certaines informations d'en-tête pour simuler un navigateur accédant au site Web.

Comment définir les en-têtes de requête pour le robot d'exploration Python

en-têtes

Navigateur Google ou Firefox, cliquez sur la page web : clic droit – Inspecter ; cliquez sur Plus d'outils – Développement ou outil ; vous pouvez également directement F12. Appuyez ensuite sur Fn+F5 pour actualiser la page Web afin d'afficher les éléments

Certains navigateurs cliquent : clic droit -> Afficher les éléments, actualiser

Recommandations associées : "Tutoriel vidéo Python

Comment définir les en-têtes de requête pour le robot dexploration Python

Remarque : Il existe de nombreux contenus dans les en-têtes, les principaux couramment utilisés sont l'agent utilisateur et l'hôte. Ils sont affichés sous forme de paires de clés If. user-agent Si vous utilisez des paires de clés de dictionnaire comme contenu des en-têtes, vous pouvez réussir l'analyse inverse et aucune autre paire de clés n'est nécessaire, sinon vous devez ajouter d'autres paires de clés sous les en-têtes ;

Paramètres

import urllib2
import urllib
values={"username":"xxxx","password":"xxxxx"}
data=urllib.urlencode(values)
url= "https://ssl.gstatic.com/gb/images/v2_730ffe61.png"
user_agent="Mozilla/5.0 (iPhone; CPU iPhone OS 11_0 like Mac OS X) AppleWebKit/604.1.38 (KHTML, like Gecko) Version/11.0 Mobile/15A372 Safari/604.1"
referer='http://www.google.com/'
headers={"User-Agent":user_agent,'Referer':referer}
request=urllib2.Request(url,data,headers)
response=urllib2.urlopen(request)
print response.read()
Copier après la connexion

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Étiquettes associées:
source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal
À propos de nous Clause de non-responsabilité Sitemap
Site Web PHP chinois:Formation PHP en ligne sur le bien-être public,Aidez les apprenants PHP à grandir rapidement!