【问题标题】:Is training data required for collaborative filtering methods?协同过滤方法是否需要训练数据?
【发布时间】:2014-06-24 18:51:27
【问题描述】:

我即将开始编写视频推荐系统,主要基于协同过滤,因为视频元数据非常稀疏,还有一些基于内容的过滤。但是,我不确定如何处理训练数据。训练数据在推荐系统中是否重要,特别是在协作方法中?如果是这样,我怎样才能生成那种数据,或者我应该寻找什么类型的数据?

【问题讨论】:

  • 您需要数据来训练模型吗?当然。您是否在询问是否需要任何用户项目交互数据,以及您已经确定的其他元数据?我认为您无法生成要从中学习的真实数据。

标签: machine-learning recommendation-engine


【解决方案1】:

任何机器学习算法都需要数据。以Matrix Factorization 方法为例。

它接收(不完整的)比率矩阵:行代表用户,列代表项目,一个单元格包含特定用户对特定项目的评分。然后通过分解这个矩阵,您可以获得每个用户和每个项目的潜在向量表示,从而允许您预测未来的费率。显然,根据模型,用户最感兴趣的是具有最高比率的未见过项目。

本质上,矩阵分解学习预测已知用户和项目的新费率。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2014-06-22
    • 2018-08-10
    • 1970-01-01
    • 2020-04-26
    • 2016-01-28
    • 2013-10-21
    • 2021-09-29
    相关资源
    最近更新 更多