Fast R-CNN 和 SPP-net 中用于假设生成的外部算法是什么？答案

【问题标题】：What's the external algorithm used for hypothesis generation in Fast R-CNN and SPP-net?Fast R-CNN 和 SPP-net 中用于假设生成的外部算法是什么？
【发布时间】：2019-08-24 14:23:19
【问题描述】：

我知道我们需要选择性搜索作为在 R-CNN 中生成感兴趣区域建议的外部算法，但在 Fast R-CNN 中，我们可以简单地获取整个图像，然后将其传递给卷积网络来创建一个feature map，然后使用单层SPP（RoI pooling layer）。

另一方面，我们在 SPP-net 中使用了多层 SPP。快速参考和理解

在慢速 R-CNN、SPP-net 和快速 R-CNN 中，感兴趣区域 (RoI) 来自一种提议方法（“选择性搜索”，?? strong> ,?? 分别）。

谁能详细解释并引用它自从以来，SPP-net 和 Fast R-CN 中明确使用了哪些提案方法，我没有明确提到它详细的研究论文？

【问题讨论】：

标签： computer-vision conv-neural-network object-detection image-segmentation faster-rcnn

【解决方案1】：

官方 github repo 显示 SPP-net 和 Fast R-CNN 都使用了与 R-CNN 相同的区域提议方法，即“选择性搜索”：

SPP_net 和 Fast R-CNN。在SPP_net repo中，有一个计算region proposal的selective search模块，在fast r-cnn repo中，作者特别提到了计算object proposal的方法是selective search。

但同样，生成区域提议也可以使用其他方法，因为 R-CNN 和 Fast R-CNN 采用目标提议方法作为独立于检测器的外部模块。

一般来说，如果一个方法产生更多的proposals，它可以提高最终的检测精度，但这当然会限制检测速度。在Faster R-CNN paper 第 2 节“相关工作”中，对所有对象建议生成方法进行了很好的总结。

对于后续问题，即如何直观地描绘特征图中的区域提议，可以用下图（ref）更好地说明：

图中左边的红色框经过卷积运算后会变成右边输出体积中的红色方块，绿色方块对应绿色方块等等。现在想象左边的整个7x7是region proposal，那么在输出特征图上，它仍然是一个 region proposal！当然实际上左边的图像有更多的像素，所以可能有很多区域提案，每个提案在输出特征图上仍然看起来像一个区域提案！

最后在原始SPP_net paper 中，作者解释了他们如何准确地将区域提议从原始图像转换到特征图上的候选窗口。

【讨论】：

谢谢，一个后续问题，我可以直观地理解 R-CNN 首先在原始像素（图像）上创建 RoI，然后应用 CNN 来获取特征图，这是我在 SPP 中没有理解的- net 和 Fast R-CNN，我们是如何通过在特征图上应用选择性搜索来获得与以前相同的投资回报率的？相同区域提案的算法。甚至应用于原始图像或特征图的不同方法会产生相同的表示，从而有助于相同或更好的对象检测精度？我没有完全理解。你能否在你的帖子中详细说明一下。
SPP-net 上的选择性搜索也发生在原始原始像素上，但 区域提议将转换为特征图上的相应区域，这就是我添加的原因解释为什么原始图像上的区域提议仍然看起来像特征图上的区域提议的部分，这也解释了为什么选择性搜索可以用作外部模块，因为它只依赖于原始输入图像。
现在为了得到一个固定的表示，特征图上的每个proposal都会经过一个池化层得到最终的表示，通常这个表示是固定长度的，不管proposal的大小。
在这三种情况下，SS算法都将应用于原始图像！没有区别！ SS 算法不会应用于特征图。只有原始图像上的边界框会转换为特征图上的边界框（n 通道和不同的纵横比。）
让我们continue this discussion in chat。