【发布时间】:2021-11-27 18:12:35
【问题描述】:
PR 曲线阈值是否有任何规则,因为在 sklearn.metrics.average_precision 中,它们会自动根据概率/置信度创建阈值,如果我有这样的输入,可能会导致奇怪的结果:
y_true = np.array([0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1])
y_scores = np.array([ 0.7088982, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0])
它将输出 mAP = 0.93333。 Sklearn 实现获得了这个数字,因为它自动使用 [0.7088982, 0] 作为阈值。当概率阈值为 0 时,所有零分数都将计为正数,从而导致高地图。这是正确的行为吗?
【问题讨论】:
标签: scikit-learn