【发布时间】:2018-06-27 07:16:20
【问题描述】:
我看到 Kubernetes 对 Spark 有很大的吸引力。它比在 Hadoop 上运行 spark 更好吗?这两种方法都以分布式方法运行。有人可以帮助我了解在 kubernetes 与 Hadoop 生态系统上运行 spark 之间的区别/比较吗?
谢谢
【问题讨论】:
-
Kubernetes 没有存储层,因此您将失去数据局部性。 Spark on YARN with HDFS 已被基准测试为最快的选择。例如,如果您只是流式传输数据而不是做大型机器学习模型,那应该没关系
标签: apache-spark hadoop kubernetes