【问题标题】:Feature Pyramid Network Receptive Field特征金字塔网络感受野
【发布时间】:2019-01-18 02:17:28
【问题描述】:

在特征金字塔网络 (paper) 中,任何 CNN 的最后一层(例如 ResNet-101)都被采用,并针对 P5、P4 和 P3 进行 2,4 和 6 的上采样。为了允许细粒度的特征图,来自 ResNet-101 中先前层的横向连接被连接起来。

在 RetinaNet (paper) 中还有 2 个金字塔层,P6 是通过在最后一个 conv 上应用 3x3 过滤器构建的。 ResNet-101 和 P7 中的层,通过在 P6 上应用 3x3 过滤器,两者的步幅均为 2。

所有特征金字塔层通过 1 个分类子网和 1 个边界框子网传播,它们共享所有特征金字塔的权重。

由于P6和P7的感受野较大,分类子网是分别取最大感受野还是每个金字塔层的感受野?

【问题讨论】:

  • 我投票结束这个问题,因为它与编程或实现无关

标签: machine-learning computer-vision conv-neural-network convolution


【解决方案1】:

我会单独说。特征金字塔的重点是使用每个尺度的特征。

【讨论】:

  • 我也会这么说,但从论文中并不清楚。我尝试深入研究 Tensorflow 对象检测 API 以及几个 Keras RetinaNet 实现,但没有一个提供太多信息。
猜你喜欢
  • 2017-12-19
  • 2020-03-27
  • 2019-01-13
  • 1970-01-01
  • 2016-02-11
  • 2016-07-21
  • 2014-06-14
  • 1970-01-01
相关资源
最近更新 更多