【发布时间】:2021-05-27 22:18:33
【问题描述】:
我已经使用以下参数设置了一个 dag
local_tz = pendulum.timezone('US/Eastern')
default_args = {
'retries': 3,
'retry_delay': timedelta(minutes=5)
}
dag = DAG(
dag_id='some_dag',
start_date=datetime(2021, 1, 8, tzinfo=local_tz),
schedule_interval='0 16 8 * *',
default_args=default_args,
catchup=True
)
我预计最近的任务运行在 5 月 8 日,但是,我只看到 2 月 8 日、3 月 8 日和 4 月 8 日。我似乎无法弄清楚为什么 Airflow 会在 4 月停止。
现在是 5 月 25 日,所以 5 月 8 日的每日运行不应该与其他月份一起回填吗?需要明确的是,我今天刚刚部署了这个 dag,所以所有执行的 dag 运行,包括丢失的 5 月 8 日都是回填。
【问题讨论】:
-
5 月将在 6 月运行
-
我不明白为什么......根据文档,第一次执行是 start_date + schedule_interval,然后在每个间隔。 5月8日已经过去了,5月不应该跑了吗?
-
如前所述,这是预期的行为,因为间隔尚未结束,5 月的运行将在 6 月运行。以this answer 为例。我的建议是使用
start_date并比较 UI 中 Dag Runs 菜单中显示的信息。 -
花了我一点时间,但它是有道理的。
标签: python airflow airflow-scheduler