目次
Python cron スケジュール タスク トリガー インターフェイスの自動検査
apscheduler がエラーを報告しました: ジョブの実行時間 …&hellip ; next run at: ……)" was missing by
misfire_grace_time パラメータ
找到任务超时的根本原因
ホームページ バックエンド開発 Python チュートリアル Python apscheduler cronスケジュールタスクトリガーインターフェイスの自動検査を実装する方法

Python apscheduler cronスケジュールタスクトリガーインターフェイスの自動検査を実装する方法

May 01, 2023 am 10:40 AM
python cron apscheduler

    Python cron スケジュール タスク トリガー インターフェイスの自動検査

    スケジュール タスクのトリガー方法にはいくつかの種類がありますが、研究開発の学生が日常業務でよく使用するのが cron です。メソッド

    APScheduler フレームワークが複数のスケジュールされたタスク メソッドをサポートしていることを確認しました

    最初に apscheduler モジュールをインストールします

    $ pip install apscheduler
    ログイン後にコピー

    コードは次のとおりです: (メソッドにはさまざまなコメントが付けられています)時間パラメーターの定義と範囲)

    from apscheduler.schedulers.blocking import BlockingScheduler
    
    
    class Timing:
        def __init__(self, start_date, end_date, hour=None):
            self.start_date = start_date
            self.end_date = end_date
            self.hour = hour
    
        def cron(self, job, *value_list):
            """cron格式 在特定时间周期性地触发"""
            # year (int 或 str) – 年,4位数字
            # month (int 或 str) – 月 (范围1-12)
            # day (int 或 str) – 日 (范围1-31)
            # week (int 或 str) – 周 (范围1-53)
            # day_of_week (int 或 str) – 周内第几天或者星期几 (范围0-6 或者 mon,tue,wed,thu,fri,sat,sun)
            # hour (int 或 str) – 时 (范围0-23)
            # minute (int 或 str) – 分 (范围0-59)
            # second (int 或 str) – 秒 (范围0-59)
            # start_date (datetime 或 str) – 最早开始日期(包含)
            # end_date (datetime 或 str) – 分 最晚结束时间(包含)
            # timezone (datetime.tzinfo 或str) – 指定时区
            scheduler = BlockingScheduler()
            scheduler.add_job(job, 'cron', start_date=self.start_date, end_date=self.end_date, hour=self.hour,
                              args=[*value_list])
            scheduler.start()
    
        def interval(self, job, *value_list):
            """interval格式 周期触发任务"""
            # weeks (int) - 间隔几周
            # days (int)  - 间隔几天
            # hours (int) - 间隔几小时
            # minutes (int) - 间隔几分钟
            # seconds (int) - 间隔多少秒
            # start_date (datetime 或 str) - 开始日期
            # end_date (datetime 或 str) - 结束日期
            # timezone (datetime.tzinfo 或str) - 时区
            scheduler = BlockingScheduler()
            # 在 2019-08-29 22:15:00至2019-08-29 22:17:00期间,每隔1分30秒 运行一次 job 方法
            scheduler.add_job(job, 'interval', minutes=1, seconds=30, start_date=self.start_date,
                              end_date=self.end_date, args=[*value_list])
            scheduler.start()
    
        @staticmethod
        def date(job, *value_list):
            """date格式 特定时间点触发"""
            # run_date (datetime 或 str) - 作业的运行日期或时间
            # timezone (datetime.tzinfo 或 str)  - 指定时区
            scheduler = BlockingScheduler()
            # 在 2019-8-30 01:00:01 运行一次 job 方法
            scheduler.add_job(job, 'date', run_date='2019-8-30 01:00:00', args=[*value_list])
            scheduler.start()
    ログイン後にコピー

    カプセル化方法はあまり汎用的ではありません。コードは後で最適化されますが、少なくとも今は使用できます、はははははははははははははははははははははははははははははははははははははははははははははははははははははははははははは

    アイデアを考えました、検査によってタスクがトリガーされ、次に DingTalk がトリガーされるため、スケジュールされたタスクは最上位レイヤーにある必要があります

    DingTalk によってカプセル化されたコードは、以前と最下位で共有され、引き続き改善されています

    if __name__ == '__main__':
        file_list = ["test_shiyan.py", "MeetSpringFestival.py"]
        # run_py(file_list)
        case_list = ["test_case_01", "test_case_02"]
        # run_case(test_sample, case_list)
        dingDing_list = [2, case_list, test_sample]
        # run_dingDing(*dingDing_list)
        Timing('2022-02-15 00:00:00', '2022-02-16 00:00:00', '0-23').cron(run_dingDing, *dingDing_list)
    ログイン後にコピー

    run_dingDing() の関数 カプセル化された Timing().cron(run_dingDing, *dingDing_list) に入れて、パラメータを run_dingDing() にタプルの形式で渡します

    は上で書いたもので、あなたはここで見ることができます

    def cron(self, job, *value_list):
            """cron格式 在特定时间周期性地触发"""
            scheduler.add_job(job, 'cron', start_date=self.start_date, end_date=self.end_date, hour=self.hour,
                                      args=[*value_list])
    ログイン後にコピー

    Timing() の初期化で時間範囲を埋めるようにしました。これにより、より快適になります。

    タイミングは、Timing().cron の実行後にトリガーできます。 () ですが、「コンピューターの電源をオンにするだけです。後でプラットフォームの調査を開始するときに、それをサーバーに保存すると便利です~

    apscheduler がエラーを報告しました: ジョブの実行時間 …&hellip ; next run at: ……)" was missing by

    apscheduler 実行プロセス中に次のようなエラーが発生します:

    ジョブ "9668_hack (トリガー) の実行時間: 間隔[1:00:00]、次回の実行時刻: 2018- 10-29 22:00:00 CST)" は 0:01:47.387821 ジョブ "9668_index (トリガー: 間隔[0:30: 00]、次回の実行時刻: 2018-10-29 21:30: 00 CST)" は 0:01:47.392574 までに失敗しました。ジョブ "9669_deep (トリガー: 間隔[1:00:00]、次回の実行時刻: 2018-10-29 22:00:00 CST)" は 0:01:47.397622 までに失敗しました。ジョブ "9669_hack (トリガー: 間隔[1:00:00]、次回の実行時刻: 2018-10-29 22: 00:00 CST)」は 0:01:47.402938 までに失敗しました。ジョブ「9669_index (トリガー: 間隔[0:30:00]、次回の実行時刻: 2018-10-29 21:30:00 CST)」の実行時間は次のとおりです。 0:01:47.407996 で見逃した

    Baidu は基本的にこの問題を指摘できませんでした。Google はキー構成を見つけましたが、それでもエラーが発生したため、何が原因であるかを調べるために情報を探し続けました。地獄がこの問題を引き起こしていました。

    Python apscheduler cronスケジュールタスクトリガーインターフェイスの自動検査を実装する方法

    misfire_grace_time パラメータ

    その中に、misfire_grace_time というパラメータが記載されていますが、このパラメータは何に使用されますか? 他の場所で説明を見つけました。他にもいくつかのパラメータがありますが、私自身の理解に基づいて包括的な概要を示します。

    • coalesce: 何らかの理由でジョブが複数回蓄積された場合実際の操作 (たとえば、システムは 5 分間ハングした後に復元され、1 分ごとに実行されるタスクがあります。論理的に言えば、当初はこの 5 分間に 5 回実行されることが「計画」されていましたが、実際には実行されませんでした) Coalesce が True の場合、次にこのジョブがエグゼキューターに送信されるとき、最後に 1 回だけ実行されます。False の場合、5 回実行されます (必ずしも必要ではありません。他の条件については、後の missfire_grace_time の説明を参照してください)

    • max_instance: これは、同じジョブのインスタンスを同時に実行できるのは最大でも複数であることを意味します。たとえば、10 分かかるジョブは、1 分ごとに 1 回実行されるように指定されています。max_instance 値が 5 の場合、6 分から 10 分目までは、すでに 5 つのインスタンスが実行されているため、新しい実行インスタンスは実行されません

    • missfire_grace_time: 上記の合体と同様のシナリオを想像してください。ジョブが最初は 14:00 に実行されましたが、何らかの理由でスケジュールされず、現在は 14:00 に実行されているとします。 14:01 では、14:00 に実行中のインスタンスが送信されると、実行がスケジュールされている時刻と現在の時刻 (ここでは 1 分) の差が、設定した 30 秒の制限を超えているかどうかがチェックされ、その後、この実行インスタンスは実行されません。

    例:

    15 分に 1 回のタスクの場合、misfire_grace_time を 100 秒に設定し、0:06 にプロンプ​​トを表示します:

    ジョブ「9392_index (トリガー: 間隔[0:15:00]、次回実行時刻: 2018-10-27 00:15:00 CST)」の実行時間は 0:06:03.931026

    説明:

    • #0:00 に実行されるはずだったタスクが何らかの理由でスケジュールされておらず、プロンプトが表示されました。次回実行する時刻 (0:15) は現在時刻 (しきい値 100 秒) と 6 分異なるため、0:15 には実行されません

    • したがって、このパラメータは通常タスクのタイムアウト許容値として理解されます。実行プログラムにタイムアウト期間を設定して与えます。実行すべき処理がこの時間範囲内に完了していない場合、TND は実行を停止する必要があります。

    そこで、構成を次のように変更しました:

     class Config(object):
     
        SCHEDULER_JOBSTORES = {
            'default': RedisJobStore(db=3,host='0.0.0.0', port=6378,password='******'),
        }
     
        SCHEDULER_EXECUTORS = {
            'default': {'type': 'processpool', 'max_workers': 50}  #用进程池提升任务处理效率
        }
     
        SCHEDULER_JOB_DEFAULTS = {
            'coalesce': True,   #积攒的任务只跑一次
            'max_instances': 1000, #支持1000个实例并发
           'misfire_grace_time':600 #600秒的任务超时容错
        }
     
        SCHEDULER_API_ENABLED = True
    ログイン後にコピー

    我本以为这样应该就没什么问题了,配置看似完美,但是现实是残忍的,盯着apscheduler日志看了一会,熟悉的“was missed by”又出现了,这时候就需要怀疑这个配置到底有没有生效了,然后发现果然没有生效,从/scheduler/jobs中可以看到任务:

     {
    "id": "9586_site_status",
    "name": "9586_site_status",
    "func": "monitor_scheduler:monitor_site_status",
    "args": [
    9586,
    "http://sl.jxcn.cn/",
    1000,
    100,
    200,
    "",
    0,
    2
    ],
    "kwargs": {},
    "trigger": "interval",
    "start_date": "2018-09-14T00:00:00+08:00",
    "end_date": "2018-12-31T00:00:00+08:00",
    "minutes": 15,
    "misfire_grace_time": 10,
    "max_instances": 3000,
    "next_run_time": "2018-10-24T18:00:00+08:00"
    }
    ログイン後にコピー

    可以看到任务中默认就有misfire_grace_time配置,没有改为600,折腾一会发现修改配置,重启与修改任务都不会生效,只能修改配置后删除任务重新添加(才能把这个默认配置用上),或者修改任务的时候把这个值改掉

     scheduler.modify_job(func=func, id=id, args=args, trigger=trigger, minutes=minutes,start_date=start_date,end_date=end_date,misfire_grace_time=600)
    ログイン後にコピー

    然后就可以了?图样图森破,missed 依然存在。

    其实从后来的报错可以发现这个容错时间是用上的,因为从执行时间加上600秒后才出现的报错。

    找到任务超时的根本原因

    那么还是回到这个超时根本问题上,即使容错时间足够长,没有这个报错了,但是一个任务执行时间过长仍然是个根本问题,所以终极思路还在于如何优化executor的执行时间上。

    当然这里根据不同的任务处理方式是不一样的,在于各自的代码了,比如更改链接方式、代码是否有冗余请求,是否可以改为异步执行,等等。

    而我自己的任务解决方式为:由接口请求改为python模块直接传参,redis链接改为内网,极大提升执行效率,所以也就控制了执行超时问题。

    以上がPython apscheduler cronスケジュールタスクトリガーインターフェイスの自動検査を実装する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

    このウェブサイトの声明
    この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

    ホットAIツール

    Undresser.AI Undress

    Undresser.AI Undress

    リアルなヌード写真を作成する AI 搭載アプリ

    AI Clothes Remover

    AI Clothes Remover

    写真から衣服を削除するオンライン AI ツール。

    Undress AI Tool

    Undress AI Tool

    脱衣画像を無料で

    Clothoff.io

    Clothoff.io

    AI衣類リムーバー

    AI Hentai Generator

    AI Hentai Generator

    AIヘンタイを無料で生成します。

    ホットツール

    メモ帳++7.3.1

    メモ帳++7.3.1

    使いやすく無料のコードエディター

    SublimeText3 中国語版

    SublimeText3 中国語版

    中国語版、とても使いやすい

    ゼンドスタジオ 13.0.1

    ゼンドスタジオ 13.0.1

    強力な PHP 統合開発環境

    ドリームウィーバー CS6

    ドリームウィーバー CS6

    ビジュアル Web 開発ツール

    SublimeText3 Mac版

    SublimeText3 Mac版

    神レベルのコード編集ソフト(SublimeText3)

    Python:ゲーム、GUIなど Python:ゲーム、GUIなど Apr 13, 2025 am 12:14 AM

    PythonはゲームとGUI開発に優れています。 1)ゲーム開発は、2Dゲームの作成に適した図面、オーディオ、その他の機能を提供し、Pygameを使用します。 2)GUI開発は、TKINTERまたはPYQTを選択できます。 TKINTERはシンプルで使いやすく、PYQTは豊富な機能を備えており、専門能力開発に適しています。

    PHPとPython:2つの一般的なプログラミング言語を比較します PHPとPython:2つの一般的なプログラミング言語を比較します Apr 14, 2025 am 12:13 AM

    PHPとPythonにはそれぞれ独自の利点があり、プロジェクトの要件に従って選択します。 1.PHPは、特にWebサイトの迅速な開発とメンテナンスに適しています。 2。Pythonは、データサイエンス、機械学習、人工知能に適しており、簡潔な構文を備えており、初心者に適しています。

    Debian Readdirが他のツールと統合する方法 Debian Readdirが他のツールと統合する方法 Apr 13, 2025 am 09:42 AM

    DebianシステムのReadDir関数は、ディレクトリコンテンツの読み取りに使用されるシステムコールであり、Cプログラミングでよく使用されます。この記事では、ReadDirを他のツールと統合して機能を強化する方法について説明します。方法1:C言語プログラムを最初にパイプラインと組み合わせて、cプログラムを作成してreaddir関数を呼び出して結果をinclude#include#include inctargc、char*argv []){dir*dir; structdireant*entry; if(argc!= 2){(argc!= 2){

    Pythonと時間:勉強時間を最大限に活用する Pythonと時間:勉強時間を最大限に活用する Apr 14, 2025 am 12:02 AM

    限られた時間でPythonの学習効率を最大化するには、PythonのDateTime、時間、およびスケジュールモジュールを使用できます。 1. DateTimeモジュールは、学習時間を記録および計画するために使用されます。 2。時間モジュールは、勉強と休息の時間を設定するのに役立ちます。 3.スケジュールモジュールは、毎週の学習タスクを自動的に配置します。

    Nginx SSL証明書更新Debianチュートリアル Nginx SSL証明書更新Debianチュートリアル Apr 13, 2025 am 07:21 AM

    この記事では、DebianシステムでNGINXSSL証明書を更新する方法について説明します。ステップ1:最初にCERTBOTをインストールして、システムがCERTBOTおよびPython3-Certbot-Nginxパッケージがインストールされていることを確認してください。インストールされていない場合は、次のコマンドを実行してください。sudoapt-getupdatesudoapt-getinstolcallcertbotthon3-certbot-nginxステップ2:certbotコマンドを取得して構成してlet'sencrypt証明書を取得し、let'sencryptコマンドを取得し、nginx:sudocertbot - nginxを構成します。

    debian opensslでHTTPSサーバーを構成する方法 debian opensslでHTTPSサーバーを構成する方法 Apr 13, 2025 am 11:03 AM

    DebianシステムでHTTPSサーバーの構成には、必要なソフトウェアのインストール、SSL証明書の生成、SSL証明書を使用するWebサーバー(ApacheやNginxなど)の構成など、いくつかのステップが含まれます。 Apachewebサーバーを使用していると仮定して、基本的なガイドです。 1.最初に必要なソフトウェアをインストールし、システムが最新であることを確認し、ApacheとOpenSSL:sudoaptupdatesudoaptupgraysudoaptinstaをインストールしてください

    DebianのGitlabのプラグイン開発ガイド DebianのGitlabのプラグイン開発ガイド Apr 13, 2025 am 08:24 AM

    DebianでGitLabプラグインを開発するには、特定の手順と知識が必要です。このプロセスを始めるのに役立つ基本的なガイドを以下に示します。最初にgitlabをインストールすると、debianシステムにgitlabをインストールする必要があります。 GitLabの公式インストールマニュアルを参照できます。 API統合を実行する前に、APIアクセストークンを取得すると、GitLabのAPIアクセストークンを最初に取得する必要があります。 gitlabダッシュボードを開き、ユーザー設定で「アクセストーケン」オプションを見つけ、新しいアクセストークンを生成します。生成されます

    Apacheとは何ですか Apacheとは何ですか Apr 13, 2025 pm 12:06 PM

    アパッチはインターネットの背後にあるヒーローです。それはWebサーバーであるだけでなく、膨大なトラフィックをサポートし、動的なコンテンツを提供する強力なプラットフォームでもあります。モジュラー設計を通じて非常に高い柔軟性を提供し、必要に応じてさまざまな機能を拡張できるようにします。ただし、モジュール性は、慎重な管理を必要とする構成とパフォーマンスの課題も提示します。 Apacheは、高度にカスタマイズ可能で複雑なニーズを満たす必要があるサーバーシナリオに適しています。

    See all articles