先说结论:在CNN中,没有放缩旋转的功能。

1. 什么是Spatial Transformer Layer

因为有pooling层的原因,所以有一点translation的功能。在下图中,通常情况下左右两个对于CNN来说是不一样的。
深度学习—— Spatial Transformer Layer
那么,Spatial Transformer Layer的功能是,想要学习一个层,能够对左图中的图片进行旋转和缩放
深度学习—— Spatial Transformer Layer

2. How to work?

学习过程中,平移本质上来说就是调整权重的过程。
深度学习—— Spatial Transformer Layer
上图中,权重相同的颜色代表相同的权值。其目标是进行向下平移,具体公式如下:
深度学习—— Spatial Transformer Layer
举个栗子:
深度学习—— Spatial Transformer Layer

  • 向下平移:把al3l1a_{l3}^{l-1}移动到al23a_{l}^{23}的位置,此时,al23a_{l}^{23}al3l1a_{l3}^{l-1}相对应,al23a_{l}^{23}与左图中其他位置的连接权重均为0
  • 向右旋转:把al3l1a_{l3}^{l-1}移动到al33a_{l}^{33}的位置,此时,al33a_{l}^{33}al3l1a_{l3}^{l-1}相对应,al33a_{l}^{33}与左图中其他位置的连接权重均为0

那么,怎么实现这种变换呢?

通过一个全连接层实现
深度学习—— Spatial Transformer Layer

2.1.1 对图片进行平移:

深度学习—— Spatial Transformer Layer
首先把图片中的每一个像素坐标化,矩阵
[2222] \begin{bmatrix} 2 &2 \\ 2 &2 \end{bmatrix}
的作用是将其放大,
[00] \begin{bmatrix} 0 \\ 0 \end{bmatrix} 的作用是控制其是否进行平移操作。

2.1.2 对图片进行缩小

深度学习—— Spatial Transformer Layer

2.1.3 对图片进行旋转

深度学习—— Spatial Transformer Layer

综上,Spatial Transformer Layer需要六个参数
深度学习—— Spatial Transformer Layer
但是,实际上在计算的过程中,如果a,b,c,d,e,fa,b,c,d,e,f的值如果是小数呢?在这样的情况下是没有办法进行可微分的操作的。因此,需要采用一种方法Interpolation操作。

深度学习—— Spatial Transformer Layer

相关文章:

  • 2021-10-26
  • 2022-12-27
  • 2021-12-10
  • 2021-08-07
猜你喜欢
  • 2021-05-18
  • 2021-05-10
  • 2021-09-09
  • 2021-06-27
  • 2021-08-05
  • 2021-08-05
  • 2021-07-22
相关资源
相似解决方案