Hadoop mapreduce 输入路径不存在（MR Job 正在寻找什么文件系统？）答案

【问题标题】：Hadoop mapreduce input path does not exists (What filesystem is MR Job looking for?)Hadoop mapreduce 输入路径不存在（MR Job 正在寻找什么文件系统？）
【发布时间】：2017-09-27 13:42:37
【问题描述】：

我正在尝试在 Hadoop 集群上运行 MR 作业。一旦我尝试成功，但从昨天开始我无法运行相同的命令，因为它找不到输入路径

这是跟踪：

[esb99usr@SBT-IPO-078 ~]$ yarn jar /tmp/mihaylov-temp/MR.jar 
ru.sbt.hadoop.mr.data.index.DayDataIndexStart -D ru.sbt.hadoop.mr.map.mb=3072 -D ru.sbt.hadoop.mr.reduce.count=8 -D ru.sbt.hadoop.mr.map.count=80 /nameservices/supercluster/esbLogs/year/2015/months/7/days/27/hrs/18/ /nameservices/supercluster/esbLogs/year/2015/months/7/days/27/sort/ 1440622800966   1440709200966

15/09/03 14:33:37 INFO client.RMProxy: Connecting to ResourceManager at SBT-IPO-077.ca.sbrf.ru/10.116.6.195:8032
15/09/03 14:33:38 INFO mapreduce.JobSubmitter: Cleaning up the staging area /nameservices/supercluster/user/esb99usr/.staging/job_1439318575767_0078
15/09/03 14:33:38 WARN security.UserGroupInformation: PriviledgedActionException as:esb99usr (auth:SIMPLE) cause:org.apache.hadoop.mapreduce.lib.input.InvalidInputException: Input path does not exist: viewfs://cluster16/nameservices/supercluster/esbLogs/year/2015/months/7/days/27/hrs/18
Exception in thread "main" org.apache.hadoop.mapreduce.lib.input.InvalidInputException: Input path does not exist: viewfs://cluster16/nameservices/supercluster/esbLogs/year/2015/months/7/days/27/hrs/18

at org.apache.hadoop.mapreduce.lib.input.FileInputFormat.singleThreadedListStatus(FileInputFormat.java:321)
        ..........


[esb99usr@SBT-IPO-078 ~]$ hdfs dfs -ls /nameservices/supercluster/esbLogs/year/2015/months/7/days/27/hrs/18/
Found 2 items
-rw-r--r--   3 wasadmin supergroup 1417233459 2015-08-27 21:39 /nameservices/supercluster/esbLogs/year/2015/months/7/days/27/hrs/18/log1.seq
-rw-r--r--   3 wasadmin supergroup    6020096 2015-08-27 21:39 /nameservices/supercluster/esbLogs/year/2015/months/7/days/27/hrs/18/log1.seq.filter

所以当我运行 MR 作业时，它声称输入路径不存在，但我可以通过 hadoop dfs -ls /.... 看到它。直到昨天它都运行良好，没有证据表明集群已关闭，Cloudera 表示它已启动并且集群的健康状况良好。这个问题怎么解决？

【问题讨论】：

你能查一下esb99usr 属于supergroup 组吗？？
@Mr.Chowdary 是的，确实如此。
@Mr.Chowdary 顺便说一句，文件权限允许任何用户读取 hdfs 文件，所以我怀疑 chmod 是问题
你可以试试这个yarn jar /tmp/mihaylov-temp/MR.jar ru.sbt.hadoop.mr.data.index.DayDataIndexStart -Dru.sbt.hadoop.mr.map.mb=3072 -Dru.sbt.hadoop.mr.reduce.count=8 -Dru.sbt.hadoop.mr.map.count=80 /nameservices/supercluster/esbLogs/year/2015/months/7/days/27/hrs/18/ /nameservices/supercluster/esbLogs/year/2015/months/7/days/27/sort/ 1440622800966 1440709200966
@Mr.Chowdary 不幸的是，这没有帮助

标签： java hadoop mapreduce hdfs hadoop-yarn

【解决方案1】：

运行作业的命令是

]$ yarn jar /tmp/mihaylov-temp/MR.jar (Main Class Name) (input file path) (output directoru path)

【讨论】：