【发布时间】:2018-10-23 06:46:26
【问题描述】:
Scikit 有一个非常有用的分类器包装器,称为 CalibratedClassifer 和 CalibratedClassifierCV,它们试图确保分类器的 predict_proba 函数真正预测概率,而不仅仅是一个任意数字(尽管可能排名靠前)介于零和一之间。
但是,在使用随机森林时,习惯上使用oob_decision_function_ 来确定训练数据的性能,但在使用校准模型时不再可用。因此,校准应该适用于新数据,但不适用于训练数据。我们如何评估训练数据的性能以确定,例如过度拟合?
【问题讨论】:
标签: python scikit-learn random-forest