【发布时间】:2009-10-20 01:36:38
【问题描述】:
我想尝试构建一个推荐系统,我的意思是一种算法,它查看用户发布的偏好和/或评论,然后为他们提出建议,类似于 netflix 或亚马逊使用的。
学习如何编写这样的东西有哪些好的资源?我应该从哪里开始?
【问题讨论】:
我想尝试构建一个推荐系统,我的意思是一种算法,它查看用户发布的偏好和/或评论,然后为他们提出建议,类似于 netflix 或亚马逊使用的。
学习如何编写这样的东西有哪些好的资源?我应该从哪里开始?
【问题讨论】:
查看Netflix Prize 及其discussion forum 上的维基百科页面。此外,有些相关的2009 GitHub Contest 是许多不同推荐引擎上完整源代码的良好来源。显然还有Wikipedia page on the topic itself,它有一些不错的链接。
如果您开始自己编写,您会想要使用语料库。我实际上建议使用Netflix Prize's data set。只需将数据集分成两部分。对第一部分进行训练,然后在第二部分上为您的算法评分。
附录:这种事情的一个有点相关和可怕的应用是predicting demographic information:用户的性别、年龄、家庭收入、智商、性取向等。你可能会做大部分这些属性与 Netflix Prize 数据集具有相当高的准确性。幸好everyone in that dataset is just a number。
【讨论】:
看看 pysuggest 一个 Python 库,它为 collaborative filtering(Amazon.com 使用)实现了各种推荐算法。
【讨论】: