这是出现类似问题的一个网页http://detail.zol.com.cn/inde...
测试代码
import urllib2
url = 'http://detail.zol.com.cn/inde...'
response = None
try:
response = urllib2.urlopen(url,timeout=5)
html = response.read()
print html
print "hehe"
except urllib2.URLError as e:
if hasattr(e, 'code'):
print 'Error code:',e.code
elif hasattr(e, 'reason'):
print 'Reason:',e.reason
finally:
if response:
response.close()
运行结果:C:Python27python.exe C:/Users/Administrator/PycharmProjects/untitled/data02
hehe
Process finished with exit code 0
这段代码运行后也是空值
page = urllib2.Request(url)
page.add_header('Referer', url)
page.add_header('User-Agent', "Mozilla/5.0 (Windows NT 6.2; rv:16.0) Gecko/20100101 Firefox/16.0")
r = urllib2.urlopen(page,timeout=5.0)
html = r.read()
soup = BeautifulSoup(html, 'lxml')
Garang dan bawa biskut
Saya mengosongkan kuki penyemak imbas Apabila saya melawat halaman ini, saya mendapati ia juga kosong, saya telah menganalisisnya dan mendapati bahawa kukinya disulitkan dan ditetapkan dengan js, anda boleh cuba menganalisis ia. Jika ia tidak berkesan, gunakan selenium Mari gunakan krom untuk melakukannya.