特征金字塔网络感受野答案

【问题标题】：Feature Pyramid Network Receptive Field特征金字塔网络感受野
【发布时间】：2019-01-18 02:17:28
【问题描述】：

在特征金字塔网络 (paper) 中，任何 CNN 的最后一层（例如 ResNet-101）都被采用，并针对 P5、P4 和 P3 进行 2,4 和 6 的上采样。为了允许细粒度的特征图，来自 ResNet-101 中先前层的横向连接被连接起来。

在 RetinaNet (paper) 中还有 2 个金字塔层，P6 是通过在最后一个 conv 上应用 3x3 过滤器构建的。 ResNet-101 和 P7 中的层，通过在 P6 上应用 3x3 过滤器，两者的步幅均为 2。

所有特征金字塔层通过 1 个分类子网和 1 个边界框子网传播，它们共享所有特征金字塔的权重。

由于P6和P7的感受野较大，分类子网是分别取最大感受野还是每个金字塔层的感受野？

【问题讨论】：

【解决方案1】：

我会单独说。特征金字塔的重点是使用每个尺度的特征。

【讨论】：

我也会这么说，但从论文中并不清楚。我尝试深入研究 Tensorflow 对象检测 API 以及几个 Keras RetinaNet 实现，但没有一个提供太多信息。