【问题标题】:the relationship between a specific layer and its receptive field特定层与其感受野之间的关系
【发布时间】:2017-02-17 23:05:35
【问题描述】:
在一篇论文中,我看到了下表关于层和它们各自的感受野之间的关系。我有两个问题:
1)如何计算这种关系,有没有公式可以遵循。
2) 例如,在最后几层中,例如pool5、fc6&fc7,具有相当大的感受野。 fc6&fc7 的感受野是 404*404。如果训练图像是256*256,是否意味着fc6&fc7 在256*256 的边界之外看到了很多像素(或者只是浪费了fc6&fc7 的能力,它有404*404 作为感受野)。在执行分类/特征提取类型的工作时,我不确定如何理解感受野在特定层方面的物理含义。
【问题讨论】:
标签:
machine-learning
computer-vision
deep-learning
【解决方案1】:
假设您有 2 层,中间有最大拉力。
第一层将是一个卷积层,过滤器为 3X3,步幅为 1X1,最大池化层为 2X2,步幅为 2X2,第二个卷积层过滤器大小为 3X3,步幅为 1X1。
第一层从原始图像中查看 3X3 的近邻,因此感受野将是 3X3。与最大池化层相比,最大池化层有效地将图像下采样了两倍,因此第二层的输入是原始图像下采样了 2 倍。现在当前层也在寻找 3X3 的邻居,但在 DOWNSAMPLED 图像上,这意味着那个效果,这个过滤器查看来自原始图像的 (downsapleFactorfilterSize)X(downsapleFactorfilterSize) 邻域的像素!所以感受野是 6X6。