python - 用urllib抓取网页上的下载链接，目标文件是xls形式，但发现抓下来的xls是空表，里面只有一句报错信息，求帮助。

Question

想用urllib抓取上交所股票列表的xls下载链接，如下图红色小框： 发现抓下来的xls只有报错信息： 请问要怎样才能把有内容的xls抓下来？ 代码如下 {代码...}

黄舟 · Answer

可以在标红线的url上看到返回的公司信息，剩下的就是模拟浏览器请求这个url了，request header中的refer一定不能省略，不然会报403

记住要模拟 refer 这一项的值。

http://blog.csdn.net/ssshen14...
这个是已有的解决方案

曾经蜡笔没有小新 · Answer

查看cookie,referer