python - scrapy抓取知网response的内容重复
黄舟
黄舟 2017-06-30 09:55:07
0
3
862

遍历请求翻页的url

for i in range(3):
    yield Request("http:xx/page/%s"%str(i),callback=self.parse_page)

结果response请求成功 但是每次内容都一样的没变化都是第一次请求时的内容,但是用postman分别请求分页的url就没有这问题。= = 是被ban了吗 之前就不会这样

黄舟
黄舟

人生最曼妙的风景,竟是内心的淡定与从容!

全部回复(3)
刘奇

那就要分析一下用postman或者浏览器访问时请求的header头和用scrapy请求头有什么区别

三叔

被反爬识别到了

洪涛

看下控制台打印的log,看看是否正确抓取了下一页
2017-06-29 09:26:13 [scrapy] DEBUG: Scraped from <200 http:xx/page/x>,
注意最后一个x(http:xx/page/x)是否是变化的

热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责声明 Sitemap
PHP中文网:公益在线PHP培训,帮助PHP学习者快速成长!