웹페이지 http://www.sse.com.cn/assortm...을 자동으로 다운로드하는 작은 프로그램을 작성하고 싶습니다. 내부 다운로드 링크는 http://query.sse.com.cn/secur.입니다.
urllib를 사용하여 403을 표시하므로 user-agent를 추가하고 200을 반환했지만 urlretrieve를 사용할 때 온라인에서 답변을 찾을 수 없습니다.
코드는 다음과 같습니다.
urllib 가져오기 요청에서
날짜/시간에서 날짜/시간 가져오기
url = 'http://query.sse.com.cn/secur...'
user_agent = 'Mozilla/5.0(Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36(KHTML, like Gecko) Chrome/55.0.2883.95 Mobile Safari/537.36'
myheaders = {'사용자 - 에이전트': user_agent}
req = 요청.요청(url, headers=myheaders)
local = "/Users/Mty/Downloads/s_data/" + str(datetime.now().date()) + " .xls"
request.urlretrieve(요청, 로컬)
오류 보고서:
추적(가장 최근 호출 마지막):
파일 "/Users/Mty/PycharmProjects/get_data/date.py", 20행, <module>
파일 "/Library/Frameworks/Python.framework/Versions/3.5/lib/python3.5/urllib/request.py", 186행, urlretrieve
으아악파일 "/Library/Frameworks/Python.framework/Versions/3.5/lib/python3.5/urllib/parse.py", 861행, 분할 유형
으아악TypeError: 예상되는 문자열 또는 바이트열류 객체
request.build_opener를 사용하여 헤드를 추가하여 문제 해결
으아악