【发布时间】:2021-05-30 12:09:58
【问题描述】:
我想使用 AWS CLI 添加一个步骤作为 spark 应用程序,但我找不到工作命令,来自 AWS 官方文档:https://docs.aws.amazon.com/cli/latest/reference/emr/add-steps.html,他们列出了 6 个示例,其中没有一个是用于 spark 的。 但我可以通过 AWS 控制台 UI 对其进行配置,并且运行良好,但为了提高效率,我希望能够通过 aws cli 进行配置。
我能想到的最接近的是这个命令:
aws emr add-steps --cluster-id j-cluster-id --steps Type=SPARK,Name='SPARK APP',ActionOnFailure=CONTINUE,Jar=s3://my-test/RandomJava-1.0-SNAPSHOT.jar,MainClass=JavaParquetExample1,Args=s3://my-test/my-file_0000_part_00.parquet,my-test --profile my-test --region us-west-2
但这导致在 AWS EMR 步骤上进行此配置:
JAR location : command-runner.jar
Main class : None
Arguments : spark-submit s3://my-test/my-file_0000_part_00.parquet my-test
Action on failure: Continue
导致失败。
正确的(成功完成,通过 AWS 控制台 UI 配置)如下所示:
JAR location : command-runner.jar
Main class : None
Arguments : spark-submit --deploy-mode cluster --class sparkExamples.JavaParquetExample1 s3://my-test/RandomJava-1.0-SNAPSHOT.jar --s3://my-test/my-file_0000_part_00.parquet --my-test
Action on failure: Continue
非常感谢任何帮助!
【问题讨论】:
-
我认为本文档包含有效示例,或者我可能没有理解您的查询docs.aws.amazon.com/emr/latest/ReleaseGuide/…
-
在此链接中的哪个示例之后,您的命令是什么?谢谢
-
您能否查看特定问题的日志(通过转到步骤,选择您的步骤,然后对于日志文件,选择标准输出或标准错误)
标签: amazon-web-services apache-spark aws-cli amazon-emr