如何在 Hadoop 2.x 中增加 hdfs 的容量答案

【问题标题】：how to increase capacity of hdfs in Hadoop 2.x如何在 Hadoop 2.x 中增加 hdfs 的容量
【发布时间】：2017-03-27 17:35:17
【问题描述】：

我一直在尝试寻找如何使用 spark 2.0.0 在 Hadoop 2.7.2 中增加 hdfs 的容量。

我读到了这个link。

但我不明白。这是我的 core-site.xml

<configuration>
  <property>
    <name>hadoop.tmp.dir</name>
    <value>hadoop_eco/hadoop/tmp</value>
  </property>

  <property>
    <name>fs.defaultFS</name>
    <value>hdfs://com1:9000</value>
  </property>
</configuration>

和 hdfs-site.xml

<configuration>
  <property>
    <name>dfs.namenode.name.dir</name>
    <value>hadoop_eco/hadoop/name</value>
  </property>

  <property>
    <name>dfs.datanode.data.dir</name>
    <value>hadoop_eco/hadoop/data</value>
  </property>

  <property>
    <name>dfs.replication</name>
    <value>3</value>
  </property>
 </configuration>

当我使用 1 个名称节点和 10 个数据节点运行 spark 时，我收到以下错误消息：

org.apache.hadoop.hdfs.StateChange: DIR* completeFile: /user/spark/_temporary/0/_temporary/attempt_201611141313_0001_m_000052_574/part-00052 由 DFSClient_NONMAPREDUCE_1638755846_140 关闭

我无法识别此错误，但它可能与磁盘容量不足有关。

我配置的容量（hdfs）是499.76GB，每个datanode的容量是49.98GB。

那么，有没有办法增加hdfs的容量呢？

【问题讨论】：

标签： hadoop apache-spark hdfs hadoop2

【解决方案1】：

我解决了。

改变hdfs的容量就是这么简单。

我尝试更改 hdfs-site.xml

  <property>
     <name>dfs.datanode.data.dir</name>
     <value>file://"your directory path"</value>
  </property>

并使用这个命令行

hadoop namenode -format stop-all.sh start-all.sh

最后使用hdfs dfsadmin -report检查你的hdfs容量

【讨论】：

这不会改变容量。这会从头开始创建全新的 HDFS，当然会丢失所有数据（或者更确切地说，您自愿解雇它们）。
如果你想增加容量，你可以简单地添加另一个数据目录并重新加载数据节点。或者，当然，提供新的 HDFS 数据节点。
哦，好吧。谢谢！你能再回答一个问题吗？如果你不介意。我收到一条新错误消息：com.esotericsoftware.kryo.KryoException: java.io.IOException: No space left on device 我使用 df -hl 检查了设备上的空间。但有足够的空间。我不知道为什么这个错误会出现在屏幕上。有问题吗？
在我看来，这个异常可能会抱怨特定机器上的可用空间，而不是 HDFS 中的可用空间。如果您仍然在本地驱动器上看到一些可用空间，请记住默认为 root 保留 5% 的块；因此，如果您的应用程序在非 root 用户下运行，它可能会耗尽空间。尝试更具体地了解设备。
好的，我会的。感谢您的建议！