【发布时间】:2015-07-28 10:19:27
【问题描述】:
我正在尝试将我们的数据加载到 hadoop hdfs 中。经过一些测试运行后,当检查 hadoop web ui 时,我意识到标题“Non-DFS used”下消耗了很多空间。事实上,“Non-DFS used”不仅仅是“DFS used”。因此,几乎一半的集群都被非 DFS 数据消耗。
即使在重新格式化 namenode 并重新启动后,这个“非 DFS”空间也没有被释放。
我也无法找到存储此“非 DFS”数据的目录,因此我可以手动删除这些文件。
我在网上阅读了许多被困在同一问题上的人的帖子,但没有一个得到明确的答案。
清空这个“非DFS”空间有那么难吗?还是我不应该删除它?我怎样才能释放这个空间?
【问题讨论】: