【发布时间】:2018-06-30 04:30:49
【问题描述】:
因为我的计算任务需要快速的磁盘 I/O,我有兴趣在运行 Spark 的 YARN 集群中的每个工作节点上安装大型 RAM 磁盘,因此想知道 YARN 集群管理器如何处理这样一个内存盘。
例如,如果我在每台 128GB RAM 机器上分配 32GB 到 RAM 磁盘,YARN 集群管理器是否知道如何分配 RAM 以避免在执行任务时过度分配内存(在这种情况下,YARN 的RAM 到被征用的任务,或者最多只有 96GB)?
如果是这样,是否有任何方法向 YARN 集群管理器指示存在 RAM 磁盘,因此 RAM 的特定分区对 YARN 是禁止的? Spark 也会知道这些限制吗?
【问题讨论】:
标签: apache-spark hadoop-yarn ramdisk