【发布时间】:2017-06-11 08:53:51
【问题描述】:
我使用 scikit-learn 训练了一个 ExtraTreesClassifier(基尼指数),它非常适合我的需求。准确度不是很好,但使用 10 倍交叉验证,AUC 为 0.95。我想在我的工作中使用这个分类器。我对 ML 很陌生,所以如果我问你一些概念上的错误,请原谅我。
我绘制了一些 ROC 曲线,通过它,我似乎有一个特定的阈值,我的分类器开始表现良好。我想在拟合的分类器上设置这个值,所以每次我调用预测时,分类器都会使用那个阈值,我可以相信 FP 和 TP 率。
我也来到了这篇文章 (scikit .predict() default threshold),其中指出阈值不是分类器的通用概念。但是由于ExtraTreesClassifier有predict_proba方法,而且ROC曲线也和thresdholds定义有关,我觉得应该可以指定。
我没有找到任何参数,也没有任何类/接口可以用来做这件事。如何使用 scikit-learn 为经过训练的 ExtraTreesClassifier(或任何其他类)设置阈值?
非常感谢, 大肠杆菌
【问题讨论】:
标签: python scikit-learn classification threshold roc