python - 爬虫没有按配置的时间运行,是为什么?
大家讲道理
大家讲道理 2017-04-18 09:48:30
0
5
235

需求是这样,我把所有的url存在了mongo库,想每天查一遍url,抓一遍数据,可是周末并没有执行,


这个项目的日志

项目配置是这样的,我修改过几次itag,让项目重跑,别的项目也遇到几天不跑

 @every(minutes=10)
    def on_start(self):
        """运行入口"""
        self.crawl('data:, on_crawl_A', callback=self.crawl_A)
        
    @config(age=60,priority=3)     
    def crawl_A(self, response):
        for page in range(1, 549):
            params = {
                'page_index': page, 'size': self.PAGE_SIZE,
                'source': 'aaa',
            }
            self.crawl(self.DATA_SERVICE_URL, params=params,
                       callback=self.query_local_api, timeout=60, proxy=False)

    @config(age=2 * 60,priority=3)
    def query_local_api(self, response):
        data = json.loads(response.text)
        if data['msg'] != 'Success':
            return
        urls = [url for url in data['body'] if url.startswith("http://")]
        print 'urls len------>{}'.format(len(urls))
        for url in urls:
            self.crawl(url, callback=self.detail_page)
    @config(age=3 * 60 * 60,priority=10)
    def detail_page(self, response):

其中query_local_api 是查询本地mongo接口返回url,其实我想这样配置

@config(age=24 * 60 * 60,priority=10)
    def detail_page(self, response):

但是发现这个age怎么配都感觉抓的不对,我理解问题?

大家讲道理
大家讲道理

光阴似箭催人老,日月如移越少年。

membalas semua(5)
PHPzhong
  1. Kod anda tidak konsisten dengan gambar yang anda siarkan Kod dijalankan setiap 10 minit, tetapi gambar di atas ialah 6 jam

  2. Cari tugasan yang anda fikir perlu disertakan, dapatkan taskid pada halaman nyahpepijat (ia berada dalam json di sebelah kiri atas), dan pergi ke halaman /task/project:taskid untuk menyemak status semasanya

大家讲道理

Saya sedang mengkaji cara menulis tugas berjadual dalam Python Anda boleh pertimbangkan untuk menggunakan apscheduler

刘奇

Malah, anda boleh mengambil langkah ke belakang dan melihatnya Masalah ini boleh diselesaikan dengan menggunakan *nix tugas berjadual crontab sistem sendiri

.
洪涛

Teka:
Mungkinkah kerana penghias yang anda tulis tidak dikendalikan dengan betul?

小葫芦

Saya sedang mengkaji cara menulis perangkak menggunakan PHP

Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan