【发布时间】:2015-05-05 07:28:54
【问题描述】:
我正在使用 AWS EC2 实例进行生物信息学工作。我有一些(约 1000 个)大文件,应该使用 EC2 实例上的脚本进行处理,结果应该上传回 S3 存储桶。我想将作业(文件)分配给多个 EC2 实例,优先以现货价格开始。
我需要的是一个简单易用的排队系统(可能是 AWS SQS 或其他),它可以将作业分配给实例并在实例失败时重新启动作业(由于现货价格过高或其他原因)。我研究过 AWS SQS 示例,但这些示例太高级了,通常涉及自动缩放和复杂的消息生成应用程序。
有人可以从概念上指出如何以最好和最简单的方式解决这个问题吗?这个简单的 AWS SQS 应用程序有什么例子吗?一堆实例应该如何启动,如何告诉然后监听队列?
对于每个输入文件,我的工作流程基本上是这样的:
aws s3 cp s3://mybucket/file localFile ## Possibly streaming the file without copy
work.py --input localFile --output outputFile
aws s3 cp outputFile s3://mybucket/output/outputFile
【问题讨论】:
标签: amazon-web-services amazon-ec2 queue message-queue