【发布时间】:2018-03-18 18:40:17
【问题描述】:
在 GoogLeNet 等 DNN 架构中,1x1 卷积被大量使用。我理解使用它们的原因主要是降维,即如果前面的卷积层有 C 个通道,我可以使用 C'
但是,与首先减少前一层中的过滤器数量相比,这样做有什么优势?例如,在 GoogLeNet 中有一个最大池化层,它有 C=480 个输出通道(之前的层也是如此)。紧随其后的 Inception 模块(inception (4a))使用三个 1x1 卷积,其中 C'=192、96、16。为什么不将前一层中的 C 从更小的开始,比如 200 或 300?当然,我还是会使用 1x1 的卷积来将维度缩减为对应的 3x3 和 5x5 过滤器。
【问题讨论】:
标签: computer-vision deep-learning