【发布时间】:2011-12-09 19:04:03
【问题描述】:
我正在尝试使用 SVM 分类器进行 3 类分类。我们如何解释 LIBSVM 预测的概率估计。它是基于实例与最大边距超平面的垂直距离吗?
请通过对 LIBSVM 分类器预测的概率估计的解释有所了解。首先调整参数C 和gamma,然后使用-b 选项在训练和测试中输出概率估计。
【问题讨论】:
我正在尝试使用 SVM 分类器进行 3 类分类。我们如何解释 LIBSVM 预测的概率估计。它是基于实例与最大边距超平面的垂直距离吗?
请通过对 LIBSVM 分类器预测的概率估计的解释有所了解。首先调整参数C 和gamma,然后使用-b 选项在训练和测试中输出概率估计。
【问题讨论】:
多类 SVM 总是被分解成几个二元分类器(通常是一组一个分类器与所有分类器)。任何二元 SVM 分类器的决策函数都会输出到分离超平面的(有符号)距离。简而言之,SVM 将输入域映射到一维实数(决策值)。预测标签由决策值的符号确定。从 SVM 模型中获取概率输出的最常用技术是通过所谓的Platt scaling (paper of LIBSVM authors)。
是否基于实例与最大边距超平面的垂直距离?
是的。 任何输出这种一维实数值的分类器都可以通过在分类器的决策值上校准逻辑函数来进行后处理以产生概率。这与标准 logistic regression 中的方法完全相同。
【讨论】:
SVM 执行二进制分类。为了实现多类分类,libsvm 执行所谓的一对多。当您调用-b 时,您得到的是与此技术相关的概率,您可以在here 中找到解释。
【讨论】: