【发布时间】:2014-07-27 21:00:38
【问题描述】:
这是 Hadoop 的工作方式吗?
客户端向NameNode提交一个MapReducer作业/程序。
-
JobTracker(驻留在 NameNode 上)将任务分配给在单个工作机器(日期节点)上运行的从属任务跟踪器
李> 每个 Tasktracker 负责执行和管理 Job Tracker 分配的各个任务
根据上述场景MapReducer 程序将在slave 节点上运行。是不是表示Job要消耗Slave计算引擎或处理能力?。
如果我想使用另一台机器(独立于 Hadoop 安装系统)执行 MapReduce 作业并使用 Hadoop Clusters 数据怎么办?
为什么要使用 Hadoop 集群? Hadoop 以一种非常有效的方式将大数据分发到它们的 DataNode(s)。
新场景如下:
一个。服务器
b.客户
a.1 ) 使用 Hadoop 集群
分发无序数据b.1) 客户端将执行(未提交到 NameNode)一个 MapReducer 作业,该作业正在从 Hadoop 集群 数据节点获取数据。如果可能,那么 JobTracker (NameNode) 和 Tasktracker (DataNode) 会发生什么?
我在这里忽略了 Hadoop 的主要部分,通过在客户端机器上执行作业,但这是我的项目要求。有什么建议吗?
【问题讨论】:
标签: java hadoop mapreduce cluster-computing distributed-computing