【发布时间】:2015-04-02 01:15:08
【问题描述】:
我有一个“研究”问题:
有没有在流学习中结合批学习(MapReduce)进行聚类的方法?
【问题讨论】:
-
现在使用 Lambda 架构实现!
标签: hadoop apache-spark spark-streaming
我有一个“研究”问题:
有没有在流学习中结合批学习(MapReduce)进行聚类的方法?
【问题讨论】:
标签: hadoop apache-spark spark-streaming
查看Apache Spark 或Google Dataflow 了解在批处理和流模式下工作的编程模型。
Apache Spark 有 mllib 用于机器学习
【讨论】:
Freeman Lab 推出了一些非常有趣的 Spark Stream/MLlib 集成工作,通过引入“健忘”参数对流执行小批量聚类
https://databricks.com/blog/2015/01/28/introducing-streaming-k-means-in-spark-1-2.html
【讨论】: