python - 用urllib抓取網頁上的下載鏈接，目標文件是xls形式，但發現抓下來的xls是空表，裡面只有一句報錯信息，求幫助。

Question

想用urllib抓取上交所股票列表的xls下載鏈接，如下圖紅色小框： 發現抓下來的xls只有報錯信息： 請問要怎樣才能把有內容的xls抓下來？代碼如下 {代碼...}

黄舟 · Answer

可以在標紅線的url上看到返回的公司信息，剩下的就是模擬瀏覽器請求這個url了，request header中的refer一定不能省略，不然會報403

記得要模擬 refer 這項的數值。

http://blog.csdn.net/ssshen14...
這個是已有的解決方案

曾经蜡笔没有小新 · Answer

查看cookie,referer