如何利用python爬虫提交json数据
PHPz
PHPz 2017-04-17 17:32:51
0
3
495

如题,目标是不需要POST的站点,已经按照抓包的结果伪装成了浏览器,似乎还少了点什么,抓包数据里面有发现JSON数据,感觉是因为这个原因,但是我不明白要如何正确提交,所以收到的是乱码字符或者是不完整的页面源码。我用浏览器获取了网页源代码做了比较确实不完整,爬虫只拿到了头部和尾部。不用管AJAX,因为就连摘取到的第一页的内容都是不完整的。

PHPz
PHPz

学习是最好的投资!

répondre à tous(3)
黄舟

Regardez la requête json et récupérez simplement les données de cette requête

伊谢尔伦

Les informations que vous avez fournies sont trop peu nombreuses. . .

  1. Que veux-tu faire ? Soumettez-vous une demande GET ? (Vous parlez d'un site sans POST)

  2. Quelle bibliothèque utilisez-vous ? urllib.request?

  3. Dans quelles circonstances recevez-vous des caractères tronqués ? Quel genre de code tronqué ? Quand recevez-vous un code source incomplet ? Comment savez-vous que le code source est incomplet ?

巴扎黑

Le contenu que vous souhaitez explorer est-il chargé via AJAX ? D'après votre description, il semble que ce que vous voulez n'est pas en HTML, mais vous l'avez trouvé en json.

Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal