【发布时间】:2016-08-30 22:03:37
【问题描述】:
我想了解以下术语:
hadoop(单节点和多节点) 火花大师 火花工人 名称节点 数据节点
到目前为止,我所了解的是 spark master 是作业执行者,负责处理所有 spark 工作者。而 hadoop 是 hdfs(我们的数据所在的地方),并且 spark 工作人员根据给他们的工作从那里读取数据。如果我错了,请纠正我。
我也想了解namenode和datanode的作用。虽然我知道namenode的作用(拥有所有datanode的元数据信息,最好只有一个,但可以是两个)并且datanode可以是多个并且拥有数据。
datanodes是同一个hadoop节点吗?
【问题讨论】:
标签: apache-spark hadoop hdfs