java - 知乎爬虫问题
PHPz
PHPz 2017-04-18 09:28:31
0
3
565

爬虫新手求助。

知乎关注的人的列表,是一个下拉加载方式的分页。

不明白怎么获取下一页的。用post和get带上右下脚的FormData请求,都是403。
“next”是什么方法

PHPz
PHPz

学习是最好的投资!

répondre à tous(3)
伊谢尔伦

next n'est pas une méthode, next est juste la valeur du champ méthode dans Form Data. Si la requête renvoie 403, voyez si vous devez apporter des informations sur l'agent utilisateur, le référent ou le cookie

迷茫

Vous pouvez faire défiler vers le bas plusieurs fois pour capturer le paquet et voir. À mon avis, le suivant est le moyen d'obtenir la page suivante, et le décalage est le numéro qui a été chargé actuellement

.
小葫芦

Vous pouvez vous référer à ce Zhihu pour collecter des robots
Lien du robot : http://www.shenjianshou.cn/in...

Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal