【问题标题】:Item recommendation service物品推荐服务
【发布时间】:2015-08-31 07:36:02
【问题描述】:

我应该使用 MyMediaLite 制作图书推荐服务。到目前为止,我已经使用 Nutch 爬虫从网站收集书籍并将信息存储到 hbase 中。问题是我实际上并不完全理解,这一切是如何运作的。例如,我必须通过测试数据和训练数据文件,以及用户-项目 ID 对和评级。但是书籍的其他信息,如类别和作者呢?在没有用户信息的情况下(到目前为止),如何通过信息等找到“相似”的书籍?是否可以直接从 hbase 传递数据,而不将其存储到文件然后导入? 或者这个工作更适合 Apache Mahout 或 LibRec?

【问题讨论】:

    标签: service recommendation-engine collaborative-filtering


    【解决方案1】:

    通常在矩阵中的用户-项目评分信息是协同过滤算法(用户-用户 CF、项目-项目 CF、矩阵分解等)的基础。您正在使用其他人的意见来形成建议。对物品本身的内容没有天生的认识。为此,您需要某种基于内容的过滤算法或数据挖掘技术。这些通常用于您描述的“用户冷启动”场景:您有很多关于项目的信息,但没有关于特定用户偏好的信息。

    首先,考虑您的最终目标和您拥有的数据。根据您的产品需求和可用数据,您可以为您的目的选择正确的算法。我强烈推荐 Coursera 上的 RecSys 课程以了解更多信息:https://www.coursera.org/learn/recommender-systems。它由该领域的领导者教授。

    【讨论】:

    • 稍后我将收集有关使用 Piwik 的用户的数据。而且我想根据作者/类别获得任何建议,我必须使用 ItemAttributeKNN 之类的方法?并感谢您的回答!
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2016-10-04
    • 1970-01-01
    • 2010-10-22
    • 1970-01-01
    相关资源
    最近更新 更多