【发布时间】:2016-12-24 18:24:27
【问题描述】:
我是计算机视觉的新手,并开始学习计算机视觉社区中非常流行的主题,即 SIFT。但我对一个实现细节感到困惑:
在检测到关键点之后,我们必须构建 4 x 4 的局部直方图,作为最终的 SIFT 描述符,对吧?每个局部直方图包含 4 x 4 像素的局部邻域的方向。所以总的来说,我们有 16 乘以 16 等于 256 个像素,它们位于关键点周围的邻域内。所以这个邻域是一个 16 x 16 的像素网格。
但是这个社区是如何详细确定的呢?邻域是否根据关键点的方向旋转?这个 256 像素邻域内的像素是否根据检测到关键点的比例而分开?
感谢大家的帮助!
【问题讨论】:
标签: computer-vision sift