【发布时间】:2017-09-29 19:18:09
【问题描述】:
我已经使用 spark 实现了 Kmeans。但是由于我的数据量很大并且功能数量很大,我想使用 Apache spark MLlib 实现小批量 kmeans。有没有关于如何实现的示例或文档?
【问题讨论】:
标签: machine-learning k-means apache-spark-mllib mini-batch
我已经使用 spark 实现了 Kmeans。但是由于我的数据量很大并且功能数量很大,我想使用 Apache spark MLlib 实现小批量 kmeans。有没有关于如何实现的示例或文档?
【问题讨论】:
标签: machine-learning k-means apache-spark-mllib mini-batch
下面的论文不涉及 apache spark MLlib,但它确实介绍了 minibatch kmeans:
斯卡利,大卫。 “网络规模的 K 均值聚类。”在第 19 届万维网国际会议论文集上,1177-1178。 ACM,2010 年。http://dl.acm.org/citation.cfm?id=1772862
【讨论】: