【发布时间】:2017-04-13 10:26:37
【问题描述】:
为了评估我的图像检索系统,我阅读了很多有关 Precision-Recall 曲线的信息。特别是我正在阅读 this 关于 VLFeat 中的特征提取器的文章和 wikipedia page 关于精确召回的文章。
我知道这条曲线对于评估我们的系统性能 w.r.t 很有用。检索到的元素数。所以我们反复计算precision-recall检索顶部元素,然后是top 2,top 3等等......但我的问题是:我们什么时候停止?
我的直觉是:当我们检索到的元素列表的召回率等于 1 时,我们停止,因此我们检索所有相关元素(即没有假阴性,只有真阳性)。
同样的问题是关于平均精度:检索结果中应该存在多少元素来计算它?如果我之前的直觉是正确的,那么我们只需要找出最小的列表 s.t.召回率为 1 并用于计算它的 AP。
我想知道为什么所有用于计算 p-r 曲线的库都没有显示这是如何实现的?
【问题讨论】:
-
我相信当我们处理完检测器产生的所有预测边界框时我们会停止。
标签: information-retrieval precision-recall