【问题标题】:Hadoop use only master node for processing dataHadoop 仅使用主节点来处理数据
【发布时间】:2014-09-20 04:41:13
【问题描述】:

我已经设置了一个 Hadoop 2.5 集群,其中包含 1 个主节点(namenode 和辅助 namenode 和 datanode)和 2 个从节点(datanode)。所有机器都使用 Linux CentOS 7 - 64 位。当我运行我的 MapReduce 程序(字数)时,我只能看到主节点正在使用额外的 CPU 和 RAM。从节点没有做任何事情。

我检查了所有名称节点的日志,从节点上没有任何问题。资源管理器正在运行,所有从节点都可以看到资源管理器。 Datanodes 在分布式数据存储方面工作,但我看不到任何分布式数据处理的迹象。我是否必须以其他方式配置 xml 配置文件,以便所有机器在我运行 MapReduce 作业时处理数据?

谢谢

【问题讨论】:

    标签: hadoop mapreduce


    【解决方案1】:

    确保您在主节点网络文件中提及了 daanodes 的 IP 地址。此外,集群中的每个节点都应该包含其他机器的 IP 地址。 除此之外,检查包含文件是否包含相关的数据节点条目。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2012-05-04
      • 1970-01-01
      • 1970-01-01
      • 2019-05-23
      • 1970-01-01
      相关资源
      最近更新 更多