物品推荐服务答案

【问题标题】：Item recommendation service物品推荐服务
【发布时间】：2015-08-31 07:36:02
【问题描述】：

我应该使用 MyMediaLite 制作图书推荐服务。到目前为止，我已经使用 Nutch 爬虫从网站收集书籍并将信息存储到 hbase 中。问题是我实际上并不完全理解，这一切是如何运作的。例如，我必须通过测试数据和训练数据文件，以及用户-项目 ID 对和评级。但是书籍的其他信息，如类别和作者呢？在没有用户信息的情况下（到目前为止），如何通过信息等找到“相似”的书籍？是否可以直接从 hbase 传递数据，而不将其存储到文件然后导入？或者这个工作更适合 Apache Mahout 或 LibRec？

【问题讨论】：

标签： service recommendation-engine collaborative-filtering

【解决方案1】：

通常在矩阵中的用户-项目评分信息是协同过滤算法（用户-用户 CF、项目-项目 CF、矩阵分解等）的基础。您正在使用其他人的意见来形成建议。对物品本身的内容没有天生的认识。为此，您需要某种基于内容的过滤算法或数据挖掘技术。这些通常用于您描述的“用户冷启动”场景：您有很多关于项目的信息，但没有关于特定用户偏好的信息。

首先，考虑您的最终目标和您拥有的数据。根据您的产品需求和可用数据，您可以为您的目的选择正确的算法。我强烈推荐 Coursera 上的 RecSys 课程以了解更多信息：https://www.coursera.org/learn/recommender-systems。它由该领域的领导者教授。

【讨论】：

稍后我将收集有关使用 Piwik 的用户的数据。而且我想根据作者/类别获得任何建议，我必须使用 ItemAttributeKNN 之类的方法？并感谢您的回答！