【发布时间】:2019-05-19 00:17:45
【问题描述】:
我有一个具有超过 100,000 个任务的气流 DAG。 我最多只能运行 1000 个任务。除了调度程序挂起之外,网络服务器无法渲染任务并且在 UI 上非常慢。
我尝试增加 min_file_process_interval 和 processor_poll_interval 配置参数。
我已将 num_duration 设置为 3600,以便调度程序每小时重新启动一次。
我对网络服务器或调度程序有什么限制吗?一般来说,Airflow 中的大量任务如何处理?任何配置设置等都会非常有帮助。
另外,我是否应该以这种规模使用 SubDagOperator?请指教。
谢谢,
【问题讨论】:
标签: python python-3.x airflow airflow-scheduler