首先是PR曲线: Precision-Recall曲线
基本定义: precision和recall的含义, preicision是在你认为(模型预测的)的正样本中, 有多大比例真的是正样本, recall则是在真正的正样本中, 有多少被你找到了(预测对了)。
问题核心: 我们需要一个对于score的threshold, 为什么呢? 比如在一个bounding box里, 我识别出来鸭子的score最高, 可是他也只有0.1, 那么他真的是鸭子吗? 很可能他还是负样本。 所以我们需要一个阈值 如果识别出了鸭子而且分数大于这个阈值才真的说他是正样本, 否则他是负样本。
那么threshold到底是怎么影响precision和recall的呢? 我们还是用鸭子的例子如果threshold太高, prediction非常严格, 所以我们认为是鸭子的基本都是鸭子,precision就高了;但也因为筛选太严格, 我们也放过了一些score比较低的鸭子, 所以recall就低了如果threshold太低, 什么都会被当成鸭子, precision就会很低, recall就会很高.
AP: PR曲线下面积 (综合考虑P与R)
mAP就是对每一个类别都计算出AP然后再计算AP平均值就好了。
Ref
https://www.zhihu.com/question/53405779