【发布时间】:2013-02-01 07:25:21
【问题描述】:
我正在尝试 vlfeat,从图像数据库中获取大量特征,并且我正在使用基本事实测试平均精度 (MAp)。总的来说,我得到了大约 40%。我看到一些论文得到了更高的 MAp,同时使用了与我非常相似的技术;标准的词袋。
我目前正在寻找获得更高 MAp 的标准词袋技术的答案。虽然我看到还有其他实现,例如 SURF 等等,但让我们坚持标准的 Lowe's SIFT 和这个问题中的标准词袋。
所以事情是这样的,我看到 vl_sift 进行了阈值处理,让您可以更严格地选择特征。目前,我知道追求更高的阈值可能会让您获得更小、更有意义的“好”功能列表,并可能减少一些嘈杂的功能。 “良好”特征意味着,给定具有不同变化的相同图像,在其他图像上也会检测到非常相似的特征。
但是,我们应该为这个阈值设置多高?有时,我看到图像根本没有返回具有更高阈值的特征。起初,我想继续调整阈值,直到我得到更好的 MAp。但同样,我认为继续调整只是为了找到各自数据库的最佳 MAp 是一个坏主意。所以我的问题是:
虽然调整阈值可能会减少特征数量,但增加阈值是否总是会返回更少数量但更好的特征?
有没有更好的方法来获得好的特征?
还有哪些其他因素可以提高获得良好特征的速度?
【问题讨论】:
-
与你使用的X参数方法无关,按照你说的调整参数是比较常见的。但是,这样做的方法与使用这样的整个数据集不同。您所做的是将训练和测试中的数据分开,然后调整训练数据的参数,并检查它们对训练数据的影响。为了获得准确的结果,必须如何在训练和测试之间进行这种分离有多种方法,但这是机器学习的所有基础。你在做这种形式的分离吗?帖子中没有提到。
标签: image-processing computer-vision sift vlfeat