我的笔记本电脑和集群上的不同结果答案

【问题标题】：Different results on my laptop and on a cluster我的笔记本电脑和集群上的不同结果
【发布时间】：2017-10-10 15:25:00
【问题描述】：

我有一个问题让我失去理智。

我有一个使用来自 mllib 的 Kmeans 的应用程序，如果我在我的 笔记本电脑 上启动它会给我一个结果和一个 cluster 给了我另一个完全不同的。事实上，我在笔记本电脑和 AWS 集群上启动了几次，每个平台的结果都相似，但在两个平台上应该是相似的。

我没有使用 Repartition，我只是使用默认参数执行它。

有什么解决办法吗？谢谢

【问题讨论】：

【解决方案1】：

Spark Kmeans 将随机化初始质心。尝试将随机种子设置为固定值。

val kmeansModel = new Kmeans().setSeed(1L).setK(k)

【讨论】：