【发布时间】:2017-06-02 14:09:30
【问题描述】:
目前,当 EMR 集群主节点停止时(关闭行为:停止而不是终止),我们会丢失集群,因为 EMR 的架构考虑到一旦主节点关闭,集群就会终止。我们身处一个硬件故障非常普遍的世界,未来某个时候 EMR master 可能会发生故障,那么我们如何恢复存储在 EMR 集群上的数据呢?
同样,如果核心节点关闭并尝试硬重启(停止和启动);终止核心节点并且提供的核心节点出现以满足所需的核心容量,并且我们从终止的核心节点丢失所有数据(HDD)(数据损坏)。
是否有任何解决方案可以防止这些类型的终止?
【问题讨论】:
标签: amazon-web-services amazon-emr elastic-map-reduce master