【发布时间】:2016-07-08 14:00:15
【问题描述】:
我们是正在从事与数据科学相关的毕业项目的学生,我们正在开发一个使用 Spark 和 python (Pyspark) 和 Android 应用程序(用户界面)的推荐引擎,我们面临很多障碍,其中之一是如何保持 Spark 脚本在云上正常运行,以实现快速处理和实时结果。 我们所知道的 EMR 比 EC2 更新,并且已经安装了 Hadoop。 我们仍然很难决定使用哪个以及它们在处理 Spark 时有什么区别。
【问题讨论】:
-
EMR 更简单,这应该是您主要关心的问题。 EMR 只是在 EC2 上运行的 Hadoop,为您预先配置,需要额外的钱。
标签: python amazon-web-services amazon-ec2 apache-spark amazon-emr