python - 網頁更新資料之後無法再抓取

Question

我抓取的網頁今天更新了一條信息，然後爬蟲運行了卻沒有抓取到. {代碼...} 希望大佬們能講的具體點然後多交流交流

我想大声告诉你 · Answer

@config （age）參數設定直接忽略了index.page的執行

迷茫 · Answer

既然 on_start 的 @every 是一天，那麼self.crawl 中設定 age=12 * 60 * 60 半天是比较合适的，保证每次 every 肯定不会被 age 所限制。另外 @config(age=10 * 24 * 60 * 60)，這是10天內不要再爬的意思啊。