【发布时间】:2020-11-03 11:33:21
【问题描述】:
我有一个生产环境,其中Airflow webserver/scheduler 在docker 实例中运行AWS。
我正在使用 AWS 蓝/绿部署来实现始终工作的服务。
当我通过AWS Codepipeline 进行新部署时,AWS B/G 在EC2 中引发一个新的docker 实例,然后删除旧的实例。完成此操作后,正在运行的任务将失败。
我知道这是由于scheduler 和webserver 之间的连接,但是尽管有retry=2 它只是失败并且没有完成重启。另一方面,当任务由于一些错误而失败时,它会重试。
我的 dags 参数是:
default_args = {
'owner': 'I',
'depends_on_past': False,
'start_date': datetime(2020, 11, 1),
'email': [' '],
'email_on_failure': False,
'email_on_retry': False,
'retries': 2,
'retry_delay': timedelta(minutes=15),
'on_failure_callback': slack_alert
}
【问题讨论】:
标签: amazon-web-services scheduled-tasks airflow