python - 抓取天猫详情页里面的月销量,反爬非常厉害
天蓬老师
天蓬老师 2017-04-18 10:29:07
0
4
939

现在需要抓取天猫详情页里面的月销量
如https://detail.tmall.com/item...

已分析得到是异步js返回的数据,接口如下
https://mdskip.taobao.com/cor...


这个地址访问几次就需要登录,登录之后多访问几次就需要输入验证码
用代理换IP也一样
各位大神有啥好办法

天蓬老师
天蓬老师

欢迎选择我的课程,让我们一起见证您的进步~~

répondre à tous(4)
左手右手慢动作

Si vous ne vous connectez pas, changez d'agent directement

Ne gardez pas de session lors du changement de proxy

巴扎黑

Pour obtenir l'entrée, vous pouvez choisir l'entrée du terminal mobile, par exemple : entrée


Les données sont directement sur la page, il est très simple d'obtenir les données, mot-clé "sellCount".

阿神

Peu importe le nombre de fois que vous visitez le navigateur, il ne vous sera pas demandé de vous connecter. Utilisez le code pour ajuster le plug-in du navigateur afin d'accéder à htmlunit

Après avoir utilisé Postman 50 fois, il ne me permet toujours pas de me connecter ni d'afficher un code de vérification. J'essaierai mon prochain message, mais l'anti-crawling de Taobao est toujours moyen.
La méthode anti-crawling de https://www.endclothing.com est vraiment accablante

Peter_Zhu

Quelqu’un a-t-il une expérience avec cela ?

Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal