【发布时间】:2011-08-06 21:58:39
【问题描述】:
在一个 3 节点的 hadoop 集群中。我希望主节点是 1 个节点。映射任务发生在一个节点,减少任务发生在一个节点。 Map 和 reduce 任务应该分开。可能吗?据我注意到两者一起运行。如果您能提供一些启示,那就太好了。谢谢!
-塞图
【问题讨论】:
在一个 3 节点的 hadoop 集群中。我希望主节点是 1 个节点。映射任务发生在一个节点,减少任务发生在一个节点。 Map 和 reduce 任务应该分开。可能吗?据我注意到两者一起运行。如果您能提供一些启示,那就太好了。谢谢!
-塞图
【问题讨论】:
这不是最佳的,因为地图输出必须始终复制到另一台服务器。
但您可以简单地修改服务器上的 mapred-site.xml。
<property>
<name>mapred.tasktracker.map.tasks.maximum</name>
<value>4</value>
<description>The maximum number of map tasks that will be run simultaneously by a task tracker.</description>
</property>
<property>
<name>mapred.tasktracker.reduce.tasks.maximum</name>
<value>4</value>
<description>The maximum number of reduce tasks that will be run simultaneously by a task tracker.</description>
</property>
在不应该运行 reducer 的服务器上,您将 reduce.task.maximum 设置为 0。对于其他服务器,反之亦然。
【讨论】: