【发布时间】:2015-12-20 06:17:23
【问题描述】:
我已按照 Apache“单节点设置”说明在单节点上设置 dfs.replication。
但是后来我遵循了“集群设置”,但它没有提到这个属性,所以我不知道这是要在 Namenode 上设置的属性,还是/仅在 Datanodes 上设置的属性..
我还了解到,在数据节点上的 dfs.datanode.data.dir 中设置多个(逗号分隔的)路径将复制所有路径上的数据。
所以我的问题是:dfs.replication 将在哪些节点上产生影响,如果为dfs.datanode.data.dir 设置了多个路径,这些额外的独立复制是否仅针对每个 Datanode,或者这些也与某些顺便说一句dfs.replication 因素?
另外,当数据已经复制到其他节点上时,Datanodes 上的额外本地复制有什么用?
【问题讨论】:
标签: hadoop hdfs replication