【发布时间】:2012-06-06 18:43:18
【问题描述】:
我希望实现一个基于项目的新闻推荐系统。有几种方法我想跟踪用户对新闻项目的兴趣;它们包括:评分 (1-5)、收藏夹、点击率和花在新闻项目上的时间。
我的问题:有哪些好的方法可以将这些不同的指标用于推荐系统?也许以某种方式合并和规范化它们?
【问题讨论】:
标签: python metrics recommendation-engine personalization cosine-similarity
我希望实现一个基于项目的新闻推荐系统。有几种方法我想跟踪用户对新闻项目的兴趣;它们包括:评分 (1-5)、收藏夹、点击率和花在新闻项目上的时间。
我的问题:有哪些好的方法可以将这些不同的指标用于推荐系统?也许以某种方式合并和规范化它们?
【问题讨论】:
标签: python metrics recommendation-engine personalization cosine-similarity
研究领域的推荐系统通常以 1 到 5 的等级工作。从用户那里获得如此明确的信号真是太好了。但是我想现实是,您系统的大多数用户实际上永远不会给出评分,在这种情况下,您没有什么可使用的。
因此,我会跟踪页面浏览量,但也会尝试加入一些明确的反馈机制(1-5、竖起或向下等)
您的算法必须考虑到这一点。
【讨论】:
对于推荐系统,有两个问题:
如何根据收集到的数字量化用户对某项商品的兴趣
如何使用量化的兴趣数据向用户推荐新商品
我猜你对第一个问题更感兴趣。
要解决第一个问题,您需要线性组合或其他一些奇特的函数来组合所有数字。确实没有适用于所有系统的单一通用功能。这在很大程度上取决于您的用户和项目的类型。如果你想要一个高质量的推荐系统,你需要有一些数据来做机器学习来训练你的功能。
对于第二个问题,它在某种程度上是同一件事,另外你需要分析所有项目以抽象出彼此之间的一些关系。您可以在 Google 上搜索“Netflix 奖”以获取一些有趣的信息。
【讨论】: