【发布时间】:2015-10-16 12:10:19
【问题描述】:
有没有办法让 sk-learn 中的分类模型输出预测的置信度或概率,而不仅仅是类(即使只有两个类)?
直观地说,有些样本应该清楚地归于一个类别,而其他样本则处于临界状态,对于某些实际问题,区分这些样本可能很有用。
【问题讨论】:
标签: machine-learning scikit-learn
有没有办法让 sk-learn 中的分类模型输出预测的置信度或概率,而不仅仅是类(即使只有两个类)?
直观地说,有些样本应该清楚地归于一个类别,而其他样本则处于临界状态,对于某些实际问题,区分这些样本可能很有用。
【问题讨论】:
标签: machine-learning scikit-learn
如果您查看分类器的 sklearn 文档,您会发现其中一些具有类似 predict_proba()(或 decision_function 之类的函数,如 SVM 和其他模型(如逻辑回归)中提到的)。一个示例在 RandomForestClassifier 文档here 中。每个类别的概率将以取决于特定模型的方式计算,但它们应该为您输入的每个样本产生每个类别的概率。
【讨论】:
是的,有。通常,您的模型将提供一个名为 decision_function 的成员函数,它返回给定样本到分离超平面的距离,您可以将其解释为置信度。
查看此example 了解 SVM 分类的使用情况。
【讨论】: