【发布时间】:2020-04-29 18:01:34
【问题描述】:
我有一个 Cloud Composer 集群,每天运行大约十几个 dag。它们都在半夜运行 5 小时。最大的 DAG 在 5 个节点上运行大约需要 3 个小时,并且大部分工作是高度可并行化的(也就是说,如果我们将其扩展到 15 个节点,它会更快地完成)。为了保持低成本(或可能降低成本)并提高我们的吞吐量,如果我可以在大型 DAG 运行时扩展集群,然后在剩下的近 20 小时内缩减它,那就太好了在集群中什么都没有发生的那一天。使用 UI,它只能让我将集群缩减到 3 个节点。
我的问题:有没有办法在一天的一部分时间里完全“关闭”Cloud Composer 集群?如果有的话,我至少可以把它带到一个节点上吗?理想情况下,这将是一项自动化任务。
【问题讨论】:
标签: etl airflow google-cloud-composer