【发布时间】:2025-12-09 07:55:01
【问题描述】:
我正在使用布尔值,试图评估 Mahout 中的推荐引擎。我的问题是关于选择评估函数的“正确”参数。提前为这篇冗长的帖子道歉。
IRStatistics evaluate(RecommenderBuilder recommenderBuilder,
DataModelBuilder dataModelBuilder,
DataModel dataModel,
IDRescorer rescorer,
int at,
double relevanceThreshold,
double evaluationPercentage) throws TasteException;
1) 你能想出一个必须使用以下两个参数的例子吗:
- DataModelBuilder dataModelBuilder
- IDRescorer rescorer
2) 对于double relevanceThreshold 变量,我设置了值GenericRecommenderIRStatsEvaluator.CHOOSE_THRESHOLD,但是,我想知道是否可以通过设置不同的值来构建“更好”的模型。
3) 在我的项目中,我需要为每个用户推荐最多 10 个项目。这是否意味着为变量 int at 设置大于 10 的值没有意义?
4) 考虑到我不必为构建模型等待很多时间而烦恼,将变量 double evaluationPercentage 设置为 1 是否是一个好习惯?你能想到 1 不会给出最优模型的任何情况吗?
5) 为什么随着推荐数量(即变量int at)的增加,精度/召回率(注意我正在处理布尔数据)会增加(我通过实验证明了这一点)?
6) spiting of both testing and training tests 在 mahout 中的哪个位置发生,我如何更改该百分比(除非基于项目的推荐不是这种情况)?
【问题讨论】:
标签: mahout