【发布时间】:2018-09-18 13:29:06
【问题描述】:
我有一个 spark 应用程序,我想在亚马逊 EMR 上运行它。但是我的应用程序失败或进入运行模式并且永远不会退出,相同的代码在 2-3 分钟内在本地机器上运行。我怀疑我创建 spark 会话的方式存在问题,我的主 conf 低于
val spark = SparkSession.builder
.master("local[2]")
.appName("Graph Creation")
.config("spark.sql.warehouse.dir", "warehouse")
.config("spark.sql.shuffle.partitions", "1")
.getOrCreate()
如何构建 Spark 会话,以便它可以在我的本地计算机和亚马逊 EMR 上运行而不会出现问题
【问题讨论】:
标签: amazon-web-services apache-spark hadoop-yarn amazon-emr