【发布时间】:2018-07-02 15:07:10
【问题描述】:
我正在尝试使用 AWS 控制台向 AWS EMR 集群提交 Spark 作业。但它失败了:
Cannot load main class from JAR。当我在 AWS EMR 控制台的Arguments 选项中将主类指定为--class 时,作业成功运行-> 添加步骤。
在本地机器上,当没有指定主类时,该作业似乎可以正常工作,如下所示:
./spark-submit /home/astro/spark-programs/SpotEMR/MyJob.jar
我已使用运行配置将主类设置为 jar。避免将主类传递为--class 的主要原因是,我必须使用 EMRAcivity 在 AWS Datapipeline 中运行此作业。在 AWS Datapipeline 中,目前无法为正在提交的作业指定主类。
任何帮助将不胜感激。
【问题讨论】:
-
@Frederic:你有什么文件可以证实这件事吗?
-
请看下面我的回答
标签: apache-spark amazon-emr amazon-data-pipeline