【问题标题】:Amazon EMR managing my spark clusterAmazon EMR 管理我的 spark 集群
【发布时间】:2016-04-19 14:53:08
【问题描述】:

我在运行 2 台工作机器的 Amazon EC2 机器上设置了 Spark。它从 cassandra 读取数据,进行一些处理并写入 sql server。我听说过亚马逊 EMR 并阅读过它。我想要一个托管系统,如果我的工作需要更多时间并在我的工作完成时关闭,我的工作机器会自动添加到我的集群中。

我可以通过 Amazon EMR 实现这一点吗?

【问题讨论】:

    标签: amazon-emr


    【解决方案1】:

    要求是:

    1. 如果我的工作需要更多时间,我的工作机器会自动添加到我的集群中。

    2. 我的工作完成后关机。

    没有。如果您的工作是从这些步骤启动的,那么 2 绝对是可能的。有一个选项可以在最后一步完成后自动终止集群。或者,这也可以使用 SDK 以编程方式完成。

    没有。 1 有点困难,但 EMR 有三类节点;主、核心和任务。创建集群后可以添加任务节点。对此的触发可能必须以编程方式或使用其他亚马逊服务(如 Lambda)来完成。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2017-07-17
      • 2016-02-10
      • 1970-01-01
      相关资源
      最近更新 更多