【问题标题】:pytorch affine_grid: what is the theta input?pytorch affine_grid:theta 输入是什么?
【发布时间】:2020-09-21 19:31:24
【问题描述】:

当尝试使用torch.nn.functional.affine_grid 时,它需要根据documentation 大小为(N x 3 x 4) 的θ 仿射矩阵。我认为一般的仿射矩阵是(N x 4 x 4)。 pytorch 中假定的仿射矩阵格式是什么?

理想的 3D 旋转仿射输入示例。感谢您的帮助。

【问题讨论】:

    标签: image-processing computer-vision pytorch


    【解决方案1】:

    您提到的尺寸适用于 3D 输入的情况,即您希望对形状为 bxcxdxhx 的输入张量应用 3D 几何变换w.
    转换为 3D 中的点(在 homogeneous coordinates 中表示为 (x, y, z, 1) 中的 4 向量)在一般情况下应该是您提到的 4x4 矩阵。
    但是,由于我们将自己限制为齐次坐标,即第四个坐标必须为 1,因此矩阵的第 4 行必须为(0, 0, 0, 1)(请参阅this)。
    因此,无需显式编码最后一行。

    总之,由 3x3 旋转 R 和 3d 平移 t 组成的 3D 变换就是 3x4 矩阵:

    theta = [R t]
    

    【讨论】:

      猜你喜欢
      • 2020-03-23
      • 1970-01-01
      • 2021-01-16
      • 1970-01-01
      • 2023-01-26
      • 1970-01-01
      • 2021-11-21
      • 2020-05-08
      • 2020-12-18
      相关资源
      最近更新 更多