sklearn 分类概率或置信度

【问题标题】：sk-learn classification probability or confidencesklearn 分类概率或置信度
【发布时间】：2015-10-16 12:10:19
【问题描述】：

有没有办法让 sk-learn 中的分类模型输出预测的置信度或概率，而不仅仅是类（即使只有两个类）？

直观地说，有些样本应该清楚地归于一个类别，而其他样本则处于临界状态，对于某些实际问题，区分这些样本可能很有用。

【问题讨论】：

【解决方案1】：

如果您查看分类器的 sklearn 文档，您会发现其中一些具有类似 predict_proba()（或 decision_function 之类的函数，如 SVM 和其他模型（如逻辑回归）中提到的）。一个示例在 RandomForestClassifier 文档here 中。每个类别的概率将以取决于特定模型的方式计算，但它们应该为您输入的每个样本产生每个类别的概率。

【讨论】：

【解决方案2】：

是的，有。通常，您的模型将提供一个名为 decision_function 的成员函数，它返回给定样本到分离超平面的距离，您可以将其解释为置信度。

查看此example 了解 SVM 分类的使用情况。

【讨论】：