【问题标题】:Where can I learn about recommendation systems?我在哪里可以了解推荐系统?
【发布时间】:2009-10-20 01:36:38
【问题描述】:

我想尝试构建一个推荐系统,我的意思是一种算法,它查看用户发布的偏好和/或评论,然后为他们提出建议,类似于 netflix 或亚马逊使用的。

学习如何编写这样的东西有哪些好的资源?我应该从哪里开始?

【问题讨论】:

    标签: recommendation-engine


    【解决方案1】:

    查看Netflix Prize 及其discussion forum 上的维基百科页面。此外,有些相关的2009 GitHub Contest 是许多不同推荐引擎上完整源代码的良好来源。显然还有Wikipedia page on the topic itself,它有一些不错的链接。

    如果您开始自己编写,您会想要使用语料库。我实际上建议使用Netflix Prize's data set。只需将数据集分成两部分。对第一部分进行训练,然后在第二部分上为您的算法评分。

    附录:这种事情的一个有点相关和可怕的应用是predicting demographic information:用户的性别、年龄、家庭收入、智商、性取向等。你可能会做大部分这些属性与 Netflix Prize 数据集具有相当高的准确性。幸好everyone in that dataset is just a number

    【讨论】:

    • 这有什么可怕的?营销人员总是试图根据您的浏览器、IP 和 HTTP 标头中的其他信息来预测您。这不是实际信息,只是“知情的刻板印象”(条件贝叶斯)。
    • 因为数据被表示为“匿名”但实际上不是?如果用户从未选择共享他们的数据,这尤其糟糕。
    • 我可能不太明白你的意思。你是说因为我可以准确猜出用户 2871875 的人口统计特征而违反了匿名性?
    • 不...阅读最后一个链接的摘要。他们正在查找用户 2871875 的记录。不仅仅是人口特征。
    【解决方案2】:

    看看 pysuggest 一个 Python 库,它为 collaborative filtering(Amazon.com 使用)实现了各种推荐算法。

    【讨论】:

      猜你喜欢
      • 2011-09-15
      • 2011-04-06
      • 1970-01-01
      • 1970-01-01
      • 2014-06-10
      • 2013-01-23
      • 2011-02-08
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多