python - 网页更新数据之后无法再次抓取

Question

我抓取的网页今天更新了一条信息，然后爬虫运行了却没有抓取到. {代码...} 希望大佬们能讲的具体点然后多交流交流

我想大声告诉你 · Answer

@config （age）参数设定直接忽略了index.page的执行

迷茫 · Answer

既然 on_start 的 @every 是一天，那么self.crawl 中设置 age=12 * 60 * 60 半天是比较合适的，保证每次 every 肯定不会被 age 所限制。另外 @config(age=10 * 24 * 60 * 60)，这是10天内不要再爬的意思啊。