【发布时间】:2014-12-15 02:41:51
【问题描述】:
我正在尝试在 AWS EMR 集群上运行作业。我遇到的问题如下:
aws java.io.IOException: No FileSystem for scheme: hdfs
我不知道我的问题到底出在哪里(在我的 java jar 作业或作业的配置中)
在我的 S3 存储桶中,我创建了一个文件夹(输入),并在其中放入了一堆文件和我的数据。然后在参数中我给出输入文件夹的路径,然后使用相同的路径作为 FileInputPath.getInputPath(args[0])。
我的问题是 - 首先作业会抓取输入文件夹中的所有文件并处理它们,还是我必须提供每个文件的所有路径?
第二个问题——如何解决上述异常?
谢谢
【问题讨论】:
标签: java hadoop amazon-web-services amazon-s3 elastic-map-reduce