【问题标题】:If master node failed then how can recover all data on master node and how to again start hadoop cluster?如果主节点发生故障,那么如何恢复主节点上的所有数据以及如何再次启动 hadoop 集群?
【发布时间】:2017-12-19 02:38:36
【问题描述】:

我有hadoop的三个master,slave1,salve2集群服务器,我的问题是,如果ambari系统的主服务器发生故障,我们该如何恢复?我们是否需要添加新服务器并再次安装 ambari,或者我们如何从故障服务器中恢复数据。如果添加了新服务器,我们可以指定为主服务器,那么我们该怎么办?可以建议我关于主服务器关闭,那么如何解决这个问题?

提前致谢。

【问题讨论】:

  • 如果您使用的是 Hadoop 2,您可以运行 Standby namenode 以实现高可用性。否则,您的集群的主节点将成为单点故障。您无法从其他任何地方检索 Namenode 的数据,因为它与您存储的通常数据不同。如果您的 namenode 出现故障,您的块和文件仍然存在,但您将无法访问它们,因为 namenode 中没有相关的元数据。

标签: hadoop hdfs ambari bigdata


【解决方案1】:

如果名称节点死亡并且您没有备份,则无法检索数据。您需要一个备份名称节点(又名辅助名称节点),它将在每个固定时间间隔后进行元数据备份。这个间隔通常很长,所以你仍然会丢失一些数据

使用 hadoop 2.0,您可以在被动名称节点的帮助下进行更频繁的备份,如果主名称节点死亡并且数据仍然可以访问,该被动名称节点将变为活动状态。

【讨论】:

  • 感谢您的回复。你的意思是如果我的主服务器由于电力故障或其他原因而崩溃,如果没有启动,那么如何获取名称节点数据?我可以从其他集群节点服务器(如 slave1 或 slave 2 服务器)检索吗?请建议我进行 hadoop echo 系统的备份恢复。
  • 这就是我解释的你需要另一个节点(辅助或被动),它将具有备份元数据,这样你就可以恢复你的主名称节点。在任何情况下,您都需要安装辅助节点。
  • 二级namenode无法去除SPOF的问题。这是由备用名称节点完成的。
  • @philantrovert 我知道他在询问获取数据的方法,这就是为什么我提到被动名称节点以及感谢您指出 SPOF
猜你喜欢
  • 2016-03-19
  • 1970-01-01
  • 2018-05-22
  • 1970-01-01
  • 2016-10-26
  • 1970-01-01
  • 1970-01-01
  • 2020-07-27
  • 1970-01-01
相关资源
最近更新 更多