用于聚类的流学习中的批量学习

【问题标题】：Batch learning in stream learning for clustering用于聚类的流学习中的批量学习
【发布时间】：2015-04-02 01:15:08
【问题描述】：

我有一个“研究”问题：

有没有在流学习中结合批学习（MapReduce）进行聚类的方法？

【问题讨论】：

现在使用 Lambda 架构实现！

标签： hadoop apache-spark spark-streaming

【解决方案1】：

查看Apache Spark 或Google Dataflow 了解在批处理和流模式下工作的编程模型。

Apache Spark 有 mllib 用于机器学习

【讨论】：

感谢您的回复！我知道 Apache Spark 是 MapReduce 框架的一个实现，它用于进行批量学习。还有用于进行流学习的 Spark Streaming。但我的问题是关于在流学习中结合批处理学习以进行聚类的方法！

【解决方案2】：

Freeman Lab 推出了一些非常有趣的 Spark Stream/MLlib 集成工作，通过引入“健忘”参数对流执行小批量聚类

https://databricks.com/blog/2015/01/28/introducing-streaming-k-means-in-spark-1-2.html

https://gist.github.com/freeman-lab/9672685

【讨论】：

猜你喜欢

2021-10-17
2018-03-17
2018-04-11
2016-11-11
1970-01-01
1970-01-01
2022-07-27
1970-01-01
2017-04-20

相关资源

下载 2021-06-26
下载 2021-06-26
下载 2021-06-06
下载 2021-06-05

最近更新更多

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode