Caffe：这两个网络有什么区别？答案

【问题标题】：Caffe: what is the difference between these 2 networks?Caffe：这两个网络有什么区别？
【发布时间】：2018-11-24 02:40:59
【问题描述】：

我很想知道网络 1 和 2 有什么区别？他们都有 16 个过滤器的 conv。

问：1 和 2 中的 16 个学习过滤器是否不同？为什么？各有优缺点？

【问题讨论】：

【解决方案1】：

假设

然后两个网络计算相同的输出。但是，我怀疑第一个选项效率更高（仅计算一次 im2col，无需复制/移动数据等...）

然而，在考虑"Dropout" 时，这两个替代方案不再等价，因为所有 16 个经过训练的过滤器的 conv16 的 dropout 模式都相同，两个 conv8 在训练期间看到不同的 dropout 模式因此可能会学习不同的内核。

【讨论】：