网页爬虫 - Python爬虫返回状态码与实际情况不符?
黄舟
黄舟 2017-04-18 10:24:31
0
2
643
import urllib2

opener = urllib2.build_opener()

html = None
response = None

response = opener.open('http://www.sxxrcs.com/was5/web/')
html = response.code
print html

比如这个爬虫,输出状态码是200。

可是直接访问http://www.sxxrcs.com/was5/web/是404,抓包响应的也是404,请问这是为什么?

黄舟
黄舟

人生最曼妙的风景,竟是内心的淡定与从容!

répondre à tous(2)
伊谢尔伦

Utiliser les requêtes

import requests

r = requests.get('http://www.sxxrcs.com/was5/web/')
print r.status_code
print r.text
小葫芦

200, c'est normal, les demandes sont pratiques et rapides.

Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal