【发布时间】:2016-07-14 23:19:43
【问题描述】:
我有一个二元分类问题,我正在尝试为我的分类器获取精确召回曲线。我使用带有 RBF 内核和概率估计选项的 libsvm。
为了获得曲线,我将决策阈值从 0 更改为 1,步长为 0.1。但是在每次运行时,即使召回率随着阈值的增加而降低,我也会获得高精度。与真阳性相比,我的假阳性率似乎总是很低。
我的结果如下:
Threshold: 0.1
TOTAL TP:393, FP:1, FN: 49
Precision:0.997462, Recall: 0.889140
Threshold: 0.2
TOTAL TP:393, FP:5, FN: 70
Precision:0.987437, Recall: 0.848812
Threshold: 0.3
TOTAL TP:354, FP:4, FN: 78
Precision:0.988827, Recall: 0.819444
Threshold: 0.4
TOTAL TP:377, FP:9, FN: 104
Precision:0.976684, Recall: 0.783784
Threshold: 0.5
TOTAL TP:377, FP:5, FN: 120
Precision:0.986911, Recall: 0.758551
Threshold: 0.6
TOTAL TP:340, FP:4, FN: 144
Precision:0.988372, Recall: 0.702479
Threshold: 0.7
TOTAL TP:316, FP:5, FN: 166
Precision:0.984424, Recall: 0.655602
Threshold: 0.8
TOTAL TP:253, FP:2, FN: 227
Precision:0.992157, Recall: 0.527083
Threshold: 0.9
TOTAL TP:167, FP:2, FN: 354
Precision:0.988166, Recall: 0.320537
这是否意味着我有一个很好的分类器或者我在某个地方有一个根本性的错误?
【问题讨论】:
标签: machine-learning classification svm libsvm