【发布时间】:2020-09-03 10:04:28
【问题描述】:
在我有关于其他项目/产品的其他隐式数据的情况下,当输入到 lightfm 模型时,设置数据的正确方法是什么。例如,我有 100k 个用户 x 200 个项目 交互数据,但是在实际应用中,我希望模型仅提供 200 个项目中的 50 个的推荐。那么如何设置数据呢?我正在考虑 2 个案例,但我不确定哪种方法是正确的:
案例 1:将整个矩阵(100k 用户 x 200 项)直接作为 lightfm 中的 interactions 参数提供。这种方式是更多的协作学习。
案例 2:仅将(100k 个用户 x 50 个项目)提供给 interactions 参数并将(100k x 150 个项目)矩阵用作 user_features。这样就可以进行更多基于内容的学习。
哪一个是正确的? 此外,对于案例 1,模型评估(精度、召回率等)的效用函数是否可以仅针对选定项目进行推荐,例如,前 k 个推荐项目应仅从 50 个项目中获取,而不应推荐其他项目并从中计算精度、召回率等。
【问题讨论】: