python – Die Webseite kann nach der Aktualisierung der Daten nicht erneut gecrawlt werden

Question

Die Webseite, die ich gecrawlt habe, hat heute eine Information aktualisiert, und dann hat der Crawler sie ausgeführt, sie aber nicht gecrawlt {Code...} Ich hoffe, die Experten können genauer sein und mehr kommunizieren.

我想大声告诉你 · Answer

@config （age）参数设定直接忽略了index.page的执行

迷茫 · Answer

既然 on_start 的 @every 是一天，那么self.crawl 中设置 age=12 * 60 * 60 半天是比较合适的，保证每次 every 肯定不会被 age 所限制。另外 @config(age=10 * 24 * 60 * 60)，这是10天内不要再爬的意思啊。