python - 为什么明明我可以访问的网站, urlopen却会报 404: Not Found

Question

有的说是因为代理.我的浏览器倒是经常开着代理, 但是我已经关闭了. 我特意查看了下HTTP报文, 也都是没经过代理的.但还是会出错. 代码: {代码...} python版本: 3.5.1 报错信息:urllib.error.HTTPError: HTTP Error...

大家讲道理 · Answer

Il n'y a aucun problème avec mon python 3.5.2 sous windows.
Il est recommandé de capturer le paquet et de le comparer avec la requête lors de l'accès par le navigateur.

Python 3.5.2 (v3.5.2:4def2a2901a5, Jun 25 2016, 22:18:55) [MSC v.1900 64 bit (AMD64)] on win32
>>> 
>>> 
>>> 
>>> import urllib.request
>>> url = "http://news.dbanotes.net/"
>>> req = urllib.request.Request(url)
>>> page = urllib.request.urlopen(req).read()
>>> page
b'

伊谢尔伦 · Answer

Cela peut être lié à la valeur du paramètre de votre agent, car certains sites Web vérifieront cela pour empêcher les non-navigateurs d'explorer

巴扎黑 · Answer

Vous copiez les en-têtes et les cookies du navigateur et les ajoutez à l'objet Request de l'urllib.
Navigateur simulé~~

天蓬老师 · Answer

Une raison très importante est que l'en-tête d'agent que vous avez demandé dans votre programme a été bloqué par l'autre partie. Essayez de modifier l'en-tête d'agent.

阿神 · Answer

Pas besoin d'utiliser Request, il suffit d'urlopen directement