import sys
import time
import requests
import json
reload(sys)
sys.setdefaultencoding('utf-8')
time=int(time.time())
session=requests.session()
user_agent='Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.87 Safari/537.36'
headers={'User-Agent':user_agent,'Host':'xygs.gsaic.gov.cn','Connection':'keep-alive','Accept':'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8'}
params={'pripid':'62030200052016012700011'}
cookies={'JSESSIONID':'2B33BC6D34DF44BE8D76C2AE20701D95'}
Url='http://xygs.gsaic.gov.cn/gsxygs/smallEnt!view.do?pripid=62030200052016012700011'
captcha=session.get(Url,headers=headers,params=(params),cookies=cookies).text
print captcha
得不到表格里的信息,求解为什么啊?
https://segmentfault.com/q/1010000005117988
Saya telah membantu anda menjawab soalan sebelum ini. Saya tidak tahu jika ia telah menyelesaikan masalah anda kod untuk soalan ini adalah seperti berikut:
Borang web menggunakan teknologi ajax. Anda boleh menggunakan Rangkaian dalam alat chrome untuk melihat sumber jadual.
Saya baru sahaja menyemak, ini kerana anda tiada pengepala protokol Accept-LanguageSelain itu, crawler bukan sahaja berdasarkan bahasa python. Anda lebih baik mempelajari sedikit pengetahuan berkaitan pembangunan web, terutamanya protokol js dan http
Maaf, saya tidak membacanya dengan teliti kerana saya menjawab melalui telefon bimbit saya