【发布时间】:2014-05-02 05:35:44
【问题描述】:
我有一个 Hadoop 集群,它有 8 台机器,所有 8 台机器都是数据节点。 有一个程序在一台机器(比如机器 A)上运行,它将在 HDFS 中连续创建序列文件(每个文件大约 1GB)。
问题是:所有 8 台机器都是相同的硬件并且具有相同的容量。当其他机器在 HDFS 磁盘上仍有大约 50% 的可用空间时,机器 A 只剩下 5%。 我查看了区块信息,发现几乎每个区块在机器 A 上都有一个副本。
有没有办法平衡副本? 谢谢。
【问题讨论】:
标签: hadoop hdfs load-balancing