【发布时间】:2013-10-11 17:27:27
【问题描述】:
我正在尝试在 Amazon EC2 上永久设置 Hadoop。目前我正在做的是每天早上启动 EC2 实例并设置 Hadoop。有什么办法可以避免这个繁琐的步骤吗?我正在寻找一个可以加载到 EC2 上的 Hadoop 映像,这对我来说很容易。
我知道我可以将 EMR 用于 hadoop 服务。但我不知道如何在不提交作业流的情况下启动 EMR (hadoop) 集群。我的意思是我需要一个不运行任何作业的 hadoop 集群。
我的最终目标是运行像Distmap 和Seal 这样的生物信息学应用程序。要运行这些应用程序,有许多依赖项。所以我需要一个免费的hadoop集群来设置环境,然后运行这些应用程序。 我希望它清楚我想要做什么。
谢谢。
【问题讨论】:
标签: linux hadoop amazon-web-services amazon-ec2 bioinformatics