【发布时间】:2018-01-14 09:49:09
【问题描述】:
我想使用 Airflow 来实现定期轮询外部系统(ftp 服务器等)的数据流,检查符合特定条件的新文件,然后为这些文件运行一堆任务。现在,我是 Airflow 的新手,并且读到 Sensors 是您可以在这种情况下使用的东西,而且我实际上设法编写了一个在我为其运行“气流测试”时工作正常的传感器。但是对于传感器的 poke_interval 和 DAG 调度的关系,我有点困惑。我应该如何为我的用例定义这些设置?还是我应该使用其他方法?我只希望 Airflow 在这些文件可用时运行任务,而不是在一段时间内没有新文件可用时让仪表板出现故障。
【问题讨论】: