【发布时间】:2017-09-25 02:40:38
【问题描述】:
我目前正在使用 Airflow 1.8.2 来安排一些 EMR 任务,然后在我们的 Redshift 集群上执行一些长时间运行的查询。为此,我正在使用 postgres_operator。查询运行大约需要 30 分钟。但是,一旦完成,连接就永远不会关闭,并且操作员会再运行一个半小时,直到每次在 2 小时标记处终止。终止消息是服务器意外关闭了连接。
我检查了 Redshift 端的日志,它显示查询已运行并且连接已关闭。不知何故,这从未传回给 Airflow。关于我可以检查的更多内容的任何指示都会有所帮助。为了提供更多信息,我的 Airflow 安装是 https://github.com/puckel/docker-airflow docker 映像的扩展,在 ECS 集群中运行并使用 SQLite 作为后端,因为我仍在测试 Airflow。另外,我使用sequential executor 作为后端。我将不胜感激在这件事上的任何帮助。
【问题讨论】:
标签: postgresql amazon-redshift airflow