CNN AlexNet 卷积层答案

【问题标题】：CNN AlexNet convolution layerCNN AlexNet 卷积层
【发布时间】：2020-04-28 12:43:46
【问题描述】：

如果我错了，请纠正我；输入图像的维度是227x227x3，所以在第一个卷积层之后，输出维度将是55x55x(3x96)=55x55x288 not 55x55x96。

见下图：

【问题讨论】：

标签： python deep-learning convolution resnet conv-neural-network

【解决方案1】：

卷积层由多个内核大小 (n x m) 的滤波器组成。每个过滤器都有维度 (n x m x c)，其中 c 是前一层的通道数。在您的示例中，输入为 227x227x3，卷积层有 96 个过滤器，参数为 11x11x3（内核大小为 11x11）。每个过滤器都会创建一个 55x55x1 的新输出通道。结果尺寸为 55x55x96。

【讨论】：

但是我们知道每个过滤器有3个通道与输入图像相同。所以每个过滤器都会创建一个 55x55x3 的新输出通道，除非我们在这 3 个通道之间进行一些魔术操作，得到 55x55x1
每个过滤器作为大小为 11x11x3 和步长（步幅）4 的滚动窗口通过输入，并应用逐元素块乘法，然后对所有值（包括通道）求和，从而得到一个放置在 55x55x1 位置之一的单个值。注意 (227 - 11)/4 + 1 = 55，这考虑了过滤器大小 (11) 和步幅 (4)。