【发布时间】:2020-09-21 19:31:24
【问题描述】:
当尝试使用torch.nn.functional.affine_grid 时,它需要根据documentation 大小为(N x 3 x 4) 的θ 仿射矩阵。我认为一般的仿射矩阵是(N x 4 x 4)。 pytorch 中假定的仿射矩阵格式是什么?
理想的 3D 旋转仿射输入示例。感谢您的帮助。
【问题讨论】:
标签: image-processing computer-vision pytorch
当尝试使用torch.nn.functional.affine_grid 时,它需要根据documentation 大小为(N x 3 x 4) 的θ 仿射矩阵。我认为一般的仿射矩阵是(N x 4 x 4)。 pytorch 中假定的仿射矩阵格式是什么?
理想的 3D 旋转仿射输入示例。感谢您的帮助。
【问题讨论】:
标签: image-processing computer-vision pytorch
您提到的尺寸适用于 3D 输入的情况,即您希望对形状为 bxcxdxhx 的输入张量应用 3D 几何变换w.
转换为 3D 中的点(在 homogeneous coordinates 中表示为 (x, y, z, 1) 中的 4 向量)在一般情况下应该是您提到的 4x4 矩阵。
但是,由于我们将自己限制为齐次坐标,即第四个坐标必须为 1,因此矩阵的第 4 行必须为(0, 0, 0, 1)(请参阅this)。
因此,无需显式编码最后一行。
总之,由 3x3 旋转 R 和 3d 平移 t 组成的 3D 变换就是 3x4 矩阵:
theta = [R t]
【讨论】: