HTTP 錯誤403:嘗試擷取歷史股票資料時禁止
此問題源自於嘗試使用urllib2 自動下載歷史股票數據,這導致了HTTP 錯誤403 Forbidden 回應。
為了解決此錯誤,已經提出了多種解決方案,包括修改使用者代理字串和接受回應 cookie。然而,這些嘗試都沒有成功。
經過進一步調查,發現透過在請求中添加額外的標頭,特別是「Accept」標頭,可以成功檢索資料。
以下程式碼片段說明了成功的實作:
import urllib2,cookielib site= "http://www.nseindia.com/live_market/dynaContent/live_watch/get_quote/getHistoricalData.jsp?symbol=JPASSOCIAT&fromDate=1-JAN-2012&toDate=1-AUG-2012&datePeriod=unselected&hiddDwnld=true" hdr = {'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.11 (KHTML, like Gecko) Chrome/23.0.1271.64 Safari/537.11', 'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8', 'Accept-Charset': 'ISO-8859-1,utf-8;q=0.7,*;q=0.3', 'Accept-Encoding': 'none', 'Accept-Language': 'en-US,en;q=0.8', 'Connection': 'keep-alive'} req = urllib2.Request(site, headers=hdr) try: page = urllib2.urlopen(req) except urllib2.HTTPError, e: print e.fp.read() content = page.read() print content
值得注意的是,僅加入「Accept」標頭就足以解決錯誤。
以上是下載歷史股票資料時如何解決HTTP錯誤403 Forbidden?的詳細內容。更多資訊請關注PHP中文網其他相關文章!