【发布时间】:2019-10-04 23:52:48
【问题描述】:
在 EMR 集群中,我有 1 个 MASTER、1 个 CORE 和 4 个 TASK 节点。似乎 YARN 不仅在 TASK 节点上,而且还在 CORE 节点上创建了 CPU 绑定的 SPARK 执行器。是否有任何选项可以阻止它(例如 'yarn.app.mapreduce.am.labels' 会指示 YARN 仅在 MASTER 或 CORE 上创建 APP MANAGER)。
【问题讨论】:
-
如果你不想要任何执行器,为什么 CORE 节点是集群的一部分?
-
只有AM。我想运行许多 AM 和单个 master 是不够的。我不想让 CORE 上的执行者不为 AM 锁定资源。
-
AM 在容器内运行。最多,您可以指定在哪个节点上运行您的 AM。这些参考资料应该可以帮助您:docs.hortonworks.com/HDPDocuments/HDP2/HDP-2.4.2/…stackoverflow.com/questions/29302659/…
-
谢谢。我尝试过这个。它几乎奏效了,但出现了一些问题,如下所示:github.com/apache/spark/pull/11129。它应该在 YARN 2.8.0 中修复。到目前为止,亚马逊安装了 2.7.3。我会等待亚马逊的更新并再次测试它。
-
年厕所。我已将其添加为答案。
标签: hadoop-yarn emr