【发布时间】:2017-04-20 05:17:16
【问题描述】:
我是 spark 新手,想知道如果我们有 2 个从属 c4.8xlarge 节点和 1 个 c4.8x 大型主节点,在 spark 作业和 AWS 中必须使用多少内核和执行程序。我尝试了不同的组合,但无法理解这个概念。
谢谢。
【问题讨论】:
-
这一切都取决于您的数据量和可用资源。
-
假设我有所有可用的资源,我将我的执行器和核心数设置为多少?
-
您使用的是哪个资源? Spark 独立或纱线或 mesos ??
-
我正在使用纱线。
标签: amazon-web-services apache-spark emr