【发布时间】:2018-06-28 23:39:37
【问题描述】:
我们在 Azure HDInsight 上使用 Spark 2.2 进行临时探索和批处理作业。
这些作业应该在 5x 中型 VM 集群上运行良好。他们是 1. 笔记本(Zeppelin 与 Livy.spark2 魔法) 2. 已编译的 jar 与 Livy 一起运行。
我必须记住在不使用时将此集群缩减为 1 个工作人员,以节省资金。 (如果可能的话,0 个工人会很好)。
我希望 Spark 为我管理这个...当作业启动时,首先将集群扩展到最小大小,然后在完成时暂停约 10 分钟。在没有 Jobs 的空闲时间之后,再次缩减。
【问题讨论】:
标签: azure apache-spark hadoop-yarn azure-hdinsight livy