【发布时间】:2018-07-20 21:10:14
【问题描述】:
我在 hdfs 中有一个文件夹,其中有两个子文件夹,每个子文件夹大约有 30 个子文件夹,最后,每个子文件夹都包含 xml 文件。 我想列出所有 xml 文件,只给出主文件夹的路径。 在本地,我可以使用apache commons-io's FileUtils.listFiles() 执行此操作。 这个我试过了
FileStatus[] status = fs.listStatus( new Path( args[ 0 ] ) );
但它只列出了前两个子文件夹,并没有更进一步。 有没有办法在hadoop中做到这一点?
【问题讨论】:
-
我知道这是一个面向 java 的问题,但如果其他阅读者可以选择使用操作系统命令,
hadoop fs -ls -R /user/your_directory应该递归列出目录