【发布时间】:2018-02-25 23:39:44
【问题描述】:
如何在 EMR 集群的后台运行定期作业? 我在 s3 中有带有 cron 作业和 application.py 的 script.sh,并希望使用以下命令运行集群:
aws emr create-cluster
--name "Test cluster"
–-release-label emr-5.12.0
--applications Name=Hive Name=Pig Name=Ganglia Name=Spark
--use-default-roles
--ec2-attributes KeyName=myKey
--instance-type m3.xlarge
--instance-count 3
--steps Type=CUSTOM_JAR,Name=CustomJAR,ActionOnFailure=CONTINUE,
Jar=s3://region.elasticmapreduce/libs/script-runner/script-runner.jar,
Args["s3://mybucket/script-path/script.sh"]
最后,我希望 script.sh 中的 cron 作业执行 application.py 现在我不明白如何在主节点上安装 cron,python 文件需要一些库,它们应该安装到。
【问题讨论】:
标签: amazon-web-services cron emr amazon-emr