Perangkak web - python merangkak tapak web dan menghuraikan kandungan bukan json
学习ing
学习ing 2017-06-28 09:26:28
0
2
1117

Saya baru belajar mendapatkan kandungan json, tetapi tapak web yang saya crawl hari ini tidak mengembalikan kandungan json, dan nombor rawak dijana selepas setiap pautan permintaan

Saya tidak tahu sama ada ia akan menjejaskan kandungan yang saya ingin merangkak

Kandungan yang perlu anda perolehi ialah kandungan di tengah-tengah gambar di bawah


Pautan laman web http://www.szse.cn/main/discl...

Kod yang saya cuba sendiri:

import requests

dir = '/Users/S1Lence/Desktop/new_html/szse/许可类重组问询函'

headers = {'Host': 'www.szse.cn',
       'Referer': 'http://www.szse.cn/main/disclosure/jgxxgk/wxhj/',
       'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_5) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/59.0.3071.109 Safari/537.36'
       }
payload= {'ACTIONID': '7',          
       'AJAX': 'AJAX-TRUE',
      'CATALOGID': 'main_wxhj',
      'TABKEY': 'tab1',
      'selecthjlb': '许可类重组问询函',
      'tab1PAGENO': '1',
      'tab1PAGECOUNT': '7',
      'tab1RECORDCOUNT': '63',
      'REPORT_ACTION': 'navigate'}
res = requests.post('http://www.szse.cn/szseWeb/FrontControllere', data=payload)
print(res.text)

Kandungan keluaran tidak seperti yang saya mahukan?

学习ing
学习ing

membalas semua(2)
黄舟

Salin maklumat pengepalanya dan gunakannya. .

漂亮男人

Alamat url siaran anda salah, sepatutnya

http://www.szse.cn/szseWeb/FrontController.szse
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan