【发布时间】:2016-10-31 15:28:37
【问题描述】:
我有用于在 KDD cup 数据集上进行异常检测的 scala 代码。 代码在https://github.com/prashantprakash/KDDDataResearch/blob/master/Code/approach1Plus2/src/main/scala/PCA.scala
我想通过使用来自 MlLib 的 StreamingKMeans 算法来尝试一种新技术,并在上述代码中的第 288 行为真时更新我的 StreamingKmeans 模型 "if(dist
我看到 StreamingKmeans 以 DStreams 的形式获取数据。 "请帮助将现有的 RDD 转换为 Dstream。"
我找到了一个链接http://apache-spark-user-list.1001560.n3.nabble.com/RDD-to-DStream-td11145.html,但没有多大帮助。
如果有更好的设计来解决问题,也请指教。
【问题讨论】:
标签: scala apache-spark k-means apache-spark-mllib