84669 orang belajar
152542 orang belajar
20005 orang belajar
5487 orang belajar
7821 orang belajar
359900 orang belajar
3350 orang belajar
180660 orang belajar
48569 orang belajar
18603 orang belajar
40936 orang belajar
1549 orang belajar
1183 orang belajar
32909 orang belajar
比如我爬去了豆瓣的Top100页面,将每本书的详情页面的URL存入MongoDB中,然后我用Redis去重。然后从Redis中获取url去爬详细的数据。现在有个问题
在Scrapy中,怎么处理MongoDB中url字段的值进入Redis。或许说。Scrapy怎么从数据库中获取url。
谢谢
认证0级讲师
Bolehkah saya menulisnya dalam start_requests? Contohnya
def start_requests(self):
r = Redis.Redis() while true: url = r.lpop('xxxx') yield scrapy.Request(url)
Bolehkah saya menulisnya dalam start_requests?
Contohnya
def start_requests(self):