1 网络结构及对比

very deep convolutional networks for lorge-scale image recognition(VGG)阅读总结
A → E:网络层从11到19层
A → A-LPN:添加了反应归一化层没有改善
B:增加了卷积层数
C: 添加了1×1的卷积层,相当于加入了非线性层(Relu)
D:将1×1换成3×3说明肥牛盖饭的感受野表现更好
E: 加到19层模型饱和

2 创新点

2.1 小的卷积核

利用3×3替代5×5和7×7:
①减少参数
②小的卷积核有更多的非线性变换,使得CNN对特征学习的能力更强。

2.2 多尺度进行训练和测试

即网络的训练和评估

3 网络的训练和评估

3.1 参数

权重初始化技巧,将A网络用到后面的网络,中间层被随机初始化。

3.2 训练和测试

  1. 训练图像大小
    单尺度训练:固定最小边s=56和s=384
    多尺度训练:尺度抖动[256,512]
  2. 测试
    将后面的全连接层换成卷积层

3.3 评估

  1. 单尺度评估
  2. 多尺度评估

4 结论

  1. 单网络性能方面最强,多网络没有超过googlenet
  2. 深度增加有利于提高性能

相关文章:

  • 2021-04-03
  • 2021-05-09
  • 2021-05-12
  • 2022-12-23
  • 2022-12-23
  • 2021-04-03
  • 2021-10-28
猜你喜欢
  • 2021-06-09
  • 2021-09-06
  • 2021-07-27
  • 2021-12-09
  • 2021-12-14
  • 2021-10-15
  • 2021-10-26
相关资源
相似解决方案