【发布时间】:2020-08-31 16:55:00
【问题描述】:
我正在使用云作曲家 composer-1.10.6-airflow-1.10.6
气流启动任务似乎存在问题并且无法跟踪它们。日志停止,最终被标记为失败,但实际上任务成功完成。如果我们配置了重试,这对于非幂等任务(如附加数据的任务)来说是一个大问题。每当发生这种情况时,我都必须手动调查该任务是否确实完成,并相应地标记该作业。
这是一个示例日志。这是此问题的典型日志。里面没有太多有用的信息,基本上它们看起来就像过早结束(因此感觉就像气流失去了工作的轨迹)。同时,作业仍然成功完成。
*** Reading remote log from gs://bucket/log/path/log.log
[2020-08-31 12:16:33,450] {taskinstance.py:630} INFO - Dependencies all met for <TaskInstance: builder.launch_loader_prd 2020-08-30T10:30:00+00:00 [queued]>
[2020-08-31 12:16:33,569] {taskinstance.py:630} INFO - Dependencies all met for <TaskInstance: builder.launch_loader_prd 2020-08-30T10:30:00+00:00 [queued]>
[2020-08-31 12:16:33,571] {taskinstance.py:841} INFO -
--------------------------------------------------------------------------------
[2020-08-31 12:16:33,572] {taskinstance.py:842} INFO - Starting attempt 1 of 1
[2020-08-31 12:16:33,572] {taskinstance.py:843} INFO -
--------------------------------------------------------------------------------
[2020-08-31 12:16:33,605] {taskinstance.py:862} INFO - Executing <Task(DataflowTemplateOperator): launch_loader_prd> on 2020-08-30T10:30:00+00:00
[2020-08-31 12:16:33,608] {base_task_runner.py:133} INFO - Running: ['airflow', 'run', 'builder', 'launch_loader_prd', '2020-08-30T10:30:00+00:00', '--job_id', '449104', '--pool', 'default_pool', '--raw', '-sd', 'DAGS_FOLDER/mydag.py', '--cfg_path', '/tmp/tmpmzlheavp']
感谢任何帮助。谢谢。
【问题讨论】:
标签: airflow google-cloud-composer