【发布时间】:2016-09-06 09:07:02
【问题描述】:
TL;DR
有没有办法判断我们的 celery worker 是否正在热关机?换句话说,我可以检查是否有SIGTERM 待处理吗?我有一个重新安排自己的任务,但如果有一个待处理的关机,我想避免重新安排自己,以避免推迟热关机。像这样的:
if not self.shutdown_pending():
self.retry(countdown=5, max_retries=3)
实际上,除了重新安排工作之外,我希望能够在收到SIGTERM 后立即退出当前的工作,以便在新代码部署时尽快重新启动我的工作人员:
@app.task(bind=True)
def my_work_task(self):
work = get_work()
for item in work:
if self.shutdown_pending():
logger.info("Shutdown detected. Bailing.")
return
item.process()
背景
我有一项任务需要花费不同的时间(从几秒到几分钟不等)。我最初使用分钟 celery-beat 计划来调用任务,但如果我只完成少量工作,只需要十秒钟即可完成,那么我想立即重新调用任务次,以避免等待 50 秒等待下一个 celery beat 到来,因为在此期间很可能会有新的工作。
所有这些都是为了尽量减少处理我的工作项的延迟。我想避免工人坐在那里无所事事的 50 秒时间,因为在此期间可能有一些工作可用。请注意,基于数据库中项目的“过期”,工作变得“准备就绪”,这就是为什么我使用 celery beat 只是在它们可用时将它们清扫,而不是直接触发任务。
我的任务如下所示:
@app.task(bind=True)
def my_work_task(self):
work = get_work()
do_some_work(work)
# if this was just a short bit of work reschedule ourselves
# immediately to avoid wasting time waiting for the
# next celery beat.
if len(work) < SMALL_WORK_THRESHOLD:
self.retry(countdown=5, max_retries=3)
这一切都很好,除了一件事:当我重新加载我的工人时(通过发送SIGTERM),我最终可能会等待一个工人重新安排自己,可能每次都有大量的工作。每次调用可能需要几分钟,直到我达到我的 max_retries 值。这使得部署新代码成为一个问题,因为工作处理几乎停止了长达几分钟。
【问题讨论】: