Hadoop 仅使用主节点来处理数据答案

【问题标题】：Hadoop use only master node for processing dataHadoop 仅使用主节点来处理数据
【发布时间】：2014-09-20 04:41:13
【问题描述】：

我已经设置了一个 Hadoop 2.5 集群，其中包含 1 个主节点（namenode 和辅助 namenode 和 datanode）和 2 个从节点（datanode）。所有机器都使用 Linux CentOS 7 - 64 位。当我运行我的 MapReduce 程序（字数）时，我只能看到主节点正在使用额外的 CPU 和 RAM。从节点没有做任何事情。

我检查了所有名称节点的日志，从节点上没有任何问题。资源管理器正在运行，所有从节点都可以看到资源管理器。 Datanodes 在分布式数据存储方面工作，但我看不到任何分布式数据处理的迹象。我是否必须以其他方式配置 xml 配置文件，以便所有机器在我运行 MapReduce 作业时处理数据？

谢谢

【问题讨论】：

标签： hadoop mapreduce

【解决方案1】：

确保您在主节点网络文件中提及了 daanodes 的 IP 地址。此外，集群中的每个节点都应该包含其他机器的 IP 地址。除此之外，检查包含文件是否包含相关的数据节点条目。

【讨论】：