【发布时间】:2012-03-27 07:02:03
【问题描述】:
我目前正在研究recommender systems,想知道其他研究人员如何获取或生成测试数据来评估系统的性能?
【问题讨论】:
标签: testing system mahout test-data
我目前正在研究recommender systems,想知道其他研究人员如何获取或生成测试数据来评估系统的性能?
【问题讨论】:
标签: testing system mahout test-data
当我使用推荐系统时,我遇到了完全相同的问题。我最喜欢 Grouplens 数据集:
您可以下载用户对电影的评分。
另外,我在博客中描述了我在研究时发现的一些数据集:
http://girlincomputerscience.blogspot.com.br/2010/12/datasets.html
希望对你有帮助!
【讨论】:
我不知道您正在评估哪个领域,但如果是电影推荐,您可以使用 GroupLens 中的 MovieLens data 开始。 (他们的网站似乎暂时关闭了,但我相信它很快就会恢复)。
他们有三组数据 - 100,000 票(偏好)、100 万票和 1000 万票 - 似乎它们或多或少是每个人开始时的标准。
【讨论】: