【问题标题】:Dataset size for recommendation algorithm推荐算法的数据集大小
【发布时间】:2014-11-21 06:44:36
【问题描述】:

我正在使用 weka 创建一个推荐系统。到目前为止,我在互联网上读到的关于数据集的内容是 它应该有更多的数据来推荐是好的。 我想知道如果我想推荐一些我们无法拥有大量数据的东西怎么办。 例如,如果想为特定城市创建公园或医院推荐系统。它不会有超过 100 个条目。那么使用小型数据集可以吗?

【问题讨论】:

  • 数据集中将包含多少个属性?这是一个复杂的问题吗?没有更多信息很难说。
  • 如果你用小数据集(比如 100 个)训练你的推荐系统,它就可以工作,但准确度可能不如 1000 个数据集。
  • @MatthewSpencer 它会有 5-7 个属性。

标签: dataset weka recommendation-engine


【解决方案1】:

正如this post 中所述,有一些指南或经验法则可用于为模型准备足够的数据。这里的一些建议包括:

  • 特征数量至少是训练案例的六倍
  • 每个类的特征数量至少是三倍

请注意,这些只是经验法则,根据您数据的复杂性,可能足够也可能不够。根据本文中概述的建议,100 个案例可能就足够了,但正如 Ramanan R 所说,更多案例可能会更好。

希望对您有所帮助!

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2012-08-06
    • 2019-05-16
    • 2011-03-18
    • 2013-08-16
    • 2012-05-28
    • 1970-01-01
    • 2013-02-28
    • 2012-06-12
    相关资源
    最近更新 更多