celery中,我做这样的处理:
一个url经过a, b, c三个的函数,分别获得返回值,其中任意函数结果均与任意其他函数结果不相关,然后汇总起来,交给之后的流程.这样,我自然想到并行运行三个函数来加快处理速度.
然而由于一开始的设计问题, a函数式被设计成了一次可以处理多个url的形式,而一个一个的处理会非常慢.
@celery.task
def a(url_list):
'...do something...'
for url in url_list:
b.delay(url)
我尝试这样控制,然而任务似乎并不能嵌套.
那么,如何设计可以比较好的满足我这种比较奇怪的流程和要求呢?
應該把a;b;c拆開,寫成3個task, 同時資料庫裡要保存一個狀態值,用來表示3個任務的執行狀態,一個任務執行完成後,就修改狀態值,並檢查其他2個任務是否完成,如果都完成了,就總結任務結果,再處理。
@xiaoboost 手工維護狀態可行,但有點費事。
Celery 是可以設計執行流程的,參考文件:Designing Work-flows
題主的需求可以用 chords 搞定,在 celery task 裡回傳值就行。
BTW: 注意 Celery 配置中與回傳值相關的幾個選項,例如這個 task_ignore_result