【问题标题】:Ambari show namenode is stop but actually namenode is still workingAmbari 显示 namenode 已停止,但实际上 namenode 仍在工作
【发布时间】:2016-05-04 06:46:45
【问题描述】:

我们将 HDP 2.7.1.2.3 与 Ambari 2.1.2 一起使用

完成设置后,每个节点的状态都是正确的。 但是有一天 ambari 突然显示 namdenode 已停止。(我们不更改 ambari 或 namenode 的任何配置) 但是,我们仍然可以使用 HBASE 并运行 MapReduce。 我们认为名称节点状态应该是正常的。

我们尝试重新启动 namenode 并检查 ambari-server 日志 它显示:

ServiceComponentHostImpl:949 - 主机角色转换到新状态,serviceComponentName=NAMENODE,oldState=STARTING,currentState=STARTED HeartBeatHandler:657 - 集群 wae 的服务 HDFS 的服务组件 NAMENODE 的状态已从 STARTED 更改为 INSTALLED

我们不明白为什么它的状态会从“STARTED”变为“INSTALLED”。 在namenode端,我们检查ambari-agent.log 它显示一个警告:

[Alert][namenode_directory_status] HA 名称服务值存在,但没有 {{hdfs-site/dfs.ha.namenodes.{{ha-nameservice}}}} 的别名

我们认为这无关紧要。

ambari认为namenode停止的原因是什么? 有什么方法可以解决这个问题吗?

【问题讨论】:

  • 你解决了吗?

标签: hadoop ambari


【解决方案1】:

从 Ambari 服务器节点的 linux 终端运行命令 ambari-server restart

从集群中所有节点的linux终端运行命令ambari-agent restart

您可以在终端以 hdfs 用户身份运行命令 hdfs dfsadmin -report 以确认所有节点都已启动并运行。

【讨论】:

  • 我运行 hdfs dfsadmin -report。报告显示数据节点状态,但没有名称节点状态。
  • namenode 没有状态是什么意思?是否处于安全模式?如果是,那么您可以尝试 hadoop fs -safemode leave 离开安全模式。
  • 报告如下: Configured Capacity: xxx Present Capacity: xxx DFS Remaining: xxx DFS Used: xxx DFS Used%: xxx Under replicated blocks: xxx Blocks with corrupt replicas: 0 Missing blocks: 0缺失块(复制因子为 1):0 ---------------------------------------- --------- Live datanodes (3):名称:数据节点1停用状态:正常,名称:数据节点2停用状态:正常,名称:数据节点3停用状态:正常,
  • 我看到 hdfs 报告看起来不错。您是否尝试过从 Ambari UI 重新启动 HDFS,然后按照我之前的评论中的建议重新启动 ambari-server 和 ambari-agent。
  • 是的。我们尝试从 ambari UI 重新启动 HDFS。 name 节点会显示“started”一段时间,然后变为“stopped”
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 2020-06-09
  • 1970-01-01
  • 1970-01-01
  • 2018-10-12
  • 1970-01-01
  • 2023-01-05
  • 1970-01-01
相关资源
最近更新 更多