【发布时间】:2015-02-24 13:52:19
【问题描述】:
我正在尝试使用基于项目的协同过滤来进行产品推荐。根据买家是否购买商品,矩阵全为 1 和 0,我使用余弦相似度来识别相似产品。
在我测试的数据中,有超过 2000 种产品,并且许多产品的可用时间不同。有些一直可用,有些过去可用但不再可用,有些最近才可用。
我注意到,已上市已久的产品往往与已上市已久的其他产品(最受欢迎的热门商品类型)相匹配。类似地,不太受欢迎且没有很长时间可用的项目往往会得到很好的匹配,但也不太受欢迎。在许多情况下,流行的产品有时会出现,而不太流行的产品却没有。
http://www.cs.umd.edu/~samir/498/Amazon-Recommendations.pdf这篇关于亚马逊的论文有伪代码,似乎建议在寻找类似于 X 的商品时只考虑购买过商品 X 的人(尽管这可能是我的误解)。这在一定程度上纠正了问题,但甚至可能过度纠正问题,因为它忽略了许多可能购买了项目 Y 而没有购买项目 X 的人。
有没有人在这些条件下尝试过基于项目的协同过滤,您对如何处理可用性不同的产品有什么建议吗?
【问题讨论】:
标签: machine-learning recommendation-engine