Saya ingin menggunakan urllib untuk merebut pautan muat turun xls senarai saham Bursa Saham Shanghai, seperti yang ditunjukkan dalam kotak merah kecil di bawah:
Saya mendapati bahawa xls yang ditangkap hanya melaporkan mesej ralat:
Bagaimana saya boleh menangkap xls dengan kandungan?
Kod adalah seperti berikut
from urllib import request
from datetime import datetime
# -*- coding:utf-8 -*-
url = 'http://query.sse.com.cn/security/stock/downloadStockListFile.do?' \
'csrcCode=&stockCode=&areaName=&stockType=1'
myheaders = [('User - Agent', 'Mozilla/5.0 (Windows; U; Windows NT 5.2) AppleWebKit/525.13'
' (KHTML, like Gecko) Version/3.1 Safari/525.13'),]
opener = request.build_opener()
opener.addheaders = myheaders
request.install_opener(opener)
local = "/Users/Mty/Downloads/data/" + str(datetime.now().date()) + " .xls"
request.urlretrieve(url, local)
Anda boleh melihat maklumat syarikat yang dikembalikan pada URL yang ditandakan dengan garis merah yang lain adalah untuk mensimulasikan penyemak imbas yang meminta URL ini. dilaporkan.
Ingat untuk mensimulasikan nilai rujukan.Ini adalah penyelesaian sedia ada
Lihat kuki,perujuk