【问题标题】:How to acquire or generate test data for a recommender system如何为推荐系统获取或生成测试数据
【发布时间】:2012-03-27 07:02:03
【问题描述】:

我目前正在研究recommender systems,想知道其他研究人员如何获取或生成测试数据来评估系统的性能?

【问题讨论】:

    标签: testing system mahout test-data


    【解决方案1】:

    当我使用推荐系统时,我遇到了完全相同的问题。我最喜欢 Grouplens 数据集:

    http://grouplens.org/node/12

    您可以下载用户对电影的评分。

    另外,我在博客中描述了我在研究时发现的一些数据集:

    http://girlincomputerscience.blogspot.com.br/2010/12/datasets.html

    希望对你有帮助!

    【讨论】:

      【解决方案2】:

      我不知道您正在评估哪个领域,但如果是电影推荐,您可以使用 GroupLens 中的 MovieLens data 开始。 (他们的网站似乎暂时关闭了,但我相信它很快就会恢复)。

      他们有三组数据 - 100,000 票(偏好)、100 万票和 1000 万票 - 似乎它们或多或少是每个人开始时的标准。

      【讨论】:

      • 太棒了!谢谢(你的)信息。如果人们正在寻找基于项目而不是基于评级的数据集怎么办?例如。协同过滤与内容过滤/项目过滤/信息检索。
      • 什么意思? Grouplens 集也可用于协同过滤。
      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2016-08-07
      • 2012-05-28
      • 2013-02-28
      • 2013-08-16
      • 2015-02-18
      • 2012-09-10
      • 2014-06-10
      相关资源
      最近更新 更多