【发布时间】:2023-04-04 06:24:01
【问题描述】:
我最近在尝试在 AWS EMR 集群上使用 Spark 时遇到了一些问题。
我正在使用类似的东西创建集群:
./elastic-mapreduce --create --alive \
--name "ll_Spark_Cluster" \
--bootstrap-action s3://elasticmapreduce/samples/spark/1.0.0/install-spark-shark.rb \
--bootstrap-name "Spark/Shark" \
--instance-type m1.xlarge \
--instance-count 2 \
--ami-version 3.0.4
问题是,每当我尝试从 S3 获取数据时,都会出现异常。 因此,如果我启动 spark-shell 并尝试以下操作:
val data = sc.textFile("s3n://your_s3_data")
我得到以下异常:
WARN storage.BlockManager: Putting block broadcast_1 failed
java.lang.NoSuchMethodError:
com.google.common.hash.HashFunction.hashInt(I)Lcom/google/common/hash/HashCode;
【问题讨论】:
-
他们是否只是发布了一个安装脚本而没有检查它是否有效?
-
在他们的官方文档中,他们使用的是 Spark 0.8.1 脚本(aws.amazon.com/articles/Elastic-MapReduce/4926593393724923),但他们确实有这个 Spark 1.0.0 脚本,不确定它是否仍处于测试阶段。我认为他们应该更明确地说明他们支持哪个版本。
标签: amazon-web-services apache-spark elastic-map-reduce