very deep convolutional networks for lorge-scale image recognition(VGG)阅读总结

文章目录

1 网络结构及对比
2 创新点

2.1 小的卷积核
2.2 多尺度进行训练和测试

3 网络的训练和评估

3.1 参数
3.2 训练和测试
3.3 评估

4 结论

1 网络结构及对比

very deep convolutional networks for lorge-scale image recognition(VGG)阅读总结
A → E：网络层从11到19层
A → A-LPN：添加了反应归一化层没有改善
B：增加了卷积层数
C: 添加了1×1的卷积层，相当于加入了非线性层（Relu）
D：将1×1换成3×3说明肥牛盖饭的感受野表现更好
E：加到19层模型饱和

2 创新点

2.1 小的卷积核

利用3×3替代5×5和7×7：
①减少参数
②小的卷积核有更多的非线性变换，使得CNN对特征学习的能力更强。

2.2 多尺度进行训练和测试

即网络的训练和评估

3 网络的训练和评估

3.1 参数

权重初始化技巧，将A网络用到后面的网络，中间层被随机初始化。

3.2 训练和测试

训练图像大小
单尺度训练：固定最小边s=56和s=384
多尺度训练：尺度抖动[256,512]
测试
将后面的全连接层换成卷积层

3.3 评估

单尺度评估
多尺度评估

4 结论

单网络性能方面最强，多网络没有超过googlenet
深度增加有利于提高性能