【发布时间】:2021-03-29 14:20:05
【问题描述】:
假设我从 RDS 读取数据并使用 EMR 集群 (Spark) 将其写入 S3,我应该只使用 Task 节点吗?
Example:
* 1 Master node
* 4 Task nodes
在我的情况下,我不使用 HDFS 来存储数据,因此如果我理解正确的话,就不需要使用 Core 节点。或者我应该至少有一个 Core 节点吗?有什么想法吗?
【问题讨论】:
-
我认为一个集群至少需要一个Core节点。
标签: amazon-web-services apache-spark amazon-emr