【发布时间】:2017-03-22 08:04:30
【问题描述】:
我是 Spark 的新手。我尝试在 Amazon EMR 上运行一个简单的应用程序(Python pi 近似值找到here),它有 1 个工作节点,第二阶段有 2 个工作节点 (m4.large)。每次完成任务所用的时间约为 25 秒。天真地,我期待 2 个节点能获得 1.5 倍的增益。我天真吗?正常吗?
【问题讨论】:
标签: python amazon-web-services apache-spark execution-time