【发布时间】:2013-11-15 16:28:27
【问题描述】:
在 HDFS 上检查文件的快速方法是使用 tail:
~$ hadoop fs -tail /path/to/file
这会显示文件中最后一千字节的数据,这非常有用。但是,相反的命令 head 似乎不是 shell 命令集合的一部分。我觉得这非常令人惊讶。
我的假设是,由于 HDFS 是为对非常大的文件进行非常快速的流式读取而构建的,因此存在一些影响head 的面向访问的问题。这让我在做访问头部的事情时犹豫不决。有人回答吗?
【问题讨论】:
-
社区对实施此类功能缺乏兴趣? https://issues.apache.org/jira/browse/HDFS-206.