【发布时间】:2016-09-08 15:03:10
【问题描述】:
我正在尝试通过以下方式从 Amazon S3 存储桶加载一些数据:
SparkConf sparkConf = new SparkConf().setAppName("Importer");
JavaSparkContext ctx = new JavaSparkContext(sparkConf);
HiveContext sqlContext = new HiveContext(ctx.sc());
DataFrame magento = sqlContext.read().json("https://s3.eu-central-1.amazonaws.com/*/*.json");
然而,最后一行会引发错误:
Exception in thread "main" java.io.IOException: No FileSystem for scheme: https
同一行一直在另一个项目中工作,我错过了什么?我在 Hortonworks CentOS VM 上运行 Spark。
【问题讨论】:
标签: java apache-spark amazon-s3