【发布时间】:2016-04-12 09:16:58
【问题描述】:
所以我使用的是样本权重函数,我不想使用默认的 sklearn 评分函数来衡量性能。
看起来它说Here 我可以传递GridSearchCV 字符串'roc_auc',它应该为我计算auc,但它计算的auc 是加权的auc 还是只是普通的auc?
【问题讨论】:
-
看来
GridSearchCV不支持sample_weight。您可以在没有权重的情况下调整模型,使用cross_val_predict,然后自己加权评分。我猜这不是你要找的。span> -
GridSearchCV通过fit_params选项接受样本权重(因为需要将样本权重传递给fit方法)。我还在使用RandomizedSearchCV,这需要相当多的复杂性才能使用cross_val_predict进行复制,所以我希望scorer自动处理权重,但我似乎在文档中找不到任何内容。 -
这真的有效吗?权重也需要分成褶皱。它们不能天真地传递给 fit 函数。
-
是的,它有效。由于输入 cv 只是一个索引,因此它只是将该索引应用于样本权重,其方式与对 X 和 y 矩阵的处理方式相同。您不会将其传递给网格搜索中的 fit 函数,而是传递给
fit_params选项。我确信这部分有效,但我不确定任何得分手都会被传递类似的论点。 -
我不敢相信它有效,但它确实有效。它不会将
sample_weight传递给记分员:-(
标签: scikit-learn grid-search auc