【发布时间】:2016-04-26 12:17:35
【问题描述】:
我正在尝试在 MLlib 中构建基于用户的协作过滤,以从 last-fm 数据集中(基于您收听的艺术家)中找到相似的用户。
Apache Mahout 可以通过 GenericBooleanPrefUserBasedRecommender 完成我想要实现的目标,但速度不够快,所以我想尝试 Spark 和 MLlib,但找不到它的任何实现。有没有人有一个有效的 java/scala/python 实现或想法如何实现它?我知道 MLlib 通过 ALS 提供基于项目的建议,但这是不同的。
【问题讨论】:
-
如果你熟悉spark MLLib对ALS的实现,你可以使用userFeatures创建用户之间的相似度矩阵,并根据相似度对结果进行排序。
标签: apache-spark apache-spark-mllib recommendation-engine mahout-recommender