1

VGG16相比AlexNet的一个改进是采用连续的几个3x3的卷积核代替AlexNet中的较大卷积核11×117×75×5(11\times11,7\times7,5\times5)。对于给定的感受野(与输出有关的输入图片的局部大小),采用堆积的小卷积核是优于采用大的卷积核,因为多层非线性层可以增加网络深度来保证学习更复杂的模式,而且代价还比较小(参数更少)。
简单来说,在VGG中,使用了3个3×33\times3卷积核来代替7×77\times7卷积核,使用了2个3×33\times3卷积核来代替5×55\times5卷积核,这样做的主要目的是在保证具有相同感知野的条件下,提升了网络的深度,在一定程度上提升了神经网络的效果。
比如,3个步长为1的3×33\times3卷积核的一层层叠加作用可看成一个大小为7的感受野(其实就表示3个3×33\times3连续卷积相当于一个7×77\times7卷积),即减少了参数;而且3×33\times3卷积核有利于更好地保持图像性质。

为什么使用2个3×33\times3卷积核可以来代替5×55\times5卷积核:
5×55\times5卷积看做一个小的全连接网络在5×55\times5区域滑动,我们可以先用一个3×33\times3的卷积滤波器卷积,然后再用一个全连接层连接这个3×33\times3卷积输出,这个全连接层我们也可以看做一个3×33\times3卷积层。这样我们就可以用两个3×33\times3卷积级联(叠加)起来代替一个5×55\times5卷积。
具体如下图所示:
VGG简单总结

相关文章:

  • 2021-09-12
  • 2021-09-16
  • 2021-08-27
  • 2022-01-19
  • 2021-12-20
  • 2021-10-18
  • 2021-07-22
  • 2021-10-30
猜你喜欢
  • 2021-10-04
  • 2022-01-08
  • 2022-01-11
  • 2021-12-12
  • 2021-06-29
  • 2021-07-18
  • 2021-04-05
相关资源
相似解决方案