python - 為解決403 加了user-agent,但之後使用urlretrieve就提示正則匹配錯誤

Question

想寫一個小程式自動下載網頁http://www.sse.com.cn/assortm...裡面的下載連結 http://query.sse.com.cn/secur...
用urllib提示403，於是加了user-agent回傳200，但之後使用urlretrieve就提示正規符合錯誤，網路上沒找到答案，請問大家要怎麼解決這個問題？

淡淡烟草味 · Answer

使用request.build_opener 新增head可解決

myheaders = [('User - Agent', 'Mozilla/5.0 (Windows; U; Windows NT 5.2) AppleWebKit/525.17'
                              ' (KHTML, like Gecko) Version/3.1 Safari/525.17'),]
opener = request.build_opener()
opener.addheaders = myheaders
request.install_opener(opener)

request.urlretrieve(url, local)

-- coding:utf-8 -