【发布时间】:2013-11-17 10:33:02
【问题描述】:
我正在开展一个需要实施文章/新闻推荐引擎的项目。 我正在考虑组合不同的方法(基于项目、基于用户、模型 CF)并且对要使用的工具有疑问。
从我的研究来看,Lucene 绝对是文本处理的工具,但对于推荐部分,它就不是那么清楚了。 如果我想基于文本相似性在文章上实现项目 CF: - 我看过使用 Mahout 和 solr (http://fr.slideshare.net/lucenerevolution/building-a-realtime-solrpowered-recommendation-engine) 的案例研究,因为它非常接近搜索问题,我认为 solr 可能更好,对吗? - 这两种工具在时间处理方面有什么区别(我认为 Mahout 更多的是批处理和 solr 实时)? - 我可以直接从 Lucene 获得文本距离吗(与 Lucene 相比,solr 的附加值对我来说不是很清楚)? - 对于更高级的方法(基于矩阵分解的模型),我会使用 Mahout,但 solr 中是否有任何类似 SVD 的功能来发现概念/标签?
感谢您的帮助。
【问题讨论】:
标签: text solr lucene mahout mahout-recommender