【发布时间】:2014-07-12 08:55:58
【问题描述】:
我很想知道HDFS是如何在Data节点上预留和分配存储空间的。
假设我在其中一个 Data 节点中有 500GB 硬盘,其中 400GB 分配给 /data 分区,据说 hadoop 就在上面。
在这里,hadoop 守护进程将占用 400GB 中的多少空间来存储输入拆分(块)。
是提前保留所有存储空间还是按需分配?
并且还想知道在设置集群时格式化名称节点是否与此有关。
非常感谢...
【问题讨论】:
-
我看不出在写入任何内容之前预先分配所有磁盘空间听起来很有用。你为什么不试试呢?