【发布时间】:2012-04-28 01:43:20
【问题描述】:
我有一个表示为 1.0 的大型偏好数据集,我正在使用 Tanimoto Similarity 函数和通用布尔用户和项目偏好推荐器。推荐值通常介于 0 和 1.0 之间。
许多来源,例如 Mahout in Action 书籍和this prior SO thread 推荐对布尔数据集使用 LogLikelihoodSimilarity 指标而不是 Tanimoto。当我切换到 LogLikelihood Similarity 指标时,它产生了一些更高范围内的分数,例如 11。我不得不回到 Tanimoto 以获得更有意义的评级。您能否提出任何可能的修复建议,还是我误解了推荐项目分数的返回值?
【问题讨论】:
标签: similarity mahout collaborative-filtering