【问题标题】:CNN AlexNet convolution layerCNN AlexNet 卷积层
【发布时间】:2020-04-28 12:43:46
【问题描述】:

如果我错了,请纠正我;输入图像的维度是227x227x3,所以在第一个卷积层之后,输出维度将是55x55x(3x96)=55x55x288 not 55x55x96

见下图:

【问题讨论】:

    标签: python deep-learning convolution resnet conv-neural-network


    【解决方案1】:

    卷积层由多个内核大小 (n x m) 的滤波器组成。每个过滤器都有维度 (n x m x c),其中 c 是前一层的通道数。在您的示例中,输入为 227x227x3,卷积层有 96 个过滤器,参数为 11x11x3(内核大小为 11x11)。每个过滤器都会创建一个 55x55x1 的新输出通道。结果尺寸为 55x55x96。

    【讨论】:

    • 但是我们知道每个过滤器有3个通道与输入图像相同。所以每个过滤器都会创建一个 55x55x3 的新输出通道,除非我们在这 3 个通道之间进行一些魔术操作,得到 55x55x1
    • 每个过滤器作为大小为 11x11x3 和步长(步幅)4 的滚动窗口通过输入,并应用逐元素块乘法,然后对所有值(包括通道)求和,从而得到一个放置在 55x55x1 位置之一的单个值。注意 (227 - 11)/4 + 1 = 55,这考虑了过滤器大小 (11) 和步幅 (4)。
    猜你喜欢
    • 2018-06-21
    • 2017-01-12
    • 1970-01-01
    • 2015-07-23
    • 1970-01-01
    • 2019-07-10
    • 2016-07-08
    • 2016-11-24
    • 2020-11-22
    相关资源
    最近更新 更多