【发布时间】:2016-07-19 19:51:59
【问题描述】:
我在试图理解本文中 HOG 特征的大小时感到困惑。Mid-level Elements for Object Detection.。在 Dalal 的工作中,一个 64*128 像素的窗口由一个 4*9*7*15=3780 维度的 HOG 特征表示。但是在这篇论文中,一个 64*64 像素的窗口由一个 6*6*31 HOG 特征表示。我已经阅读了其中引用的参考资料,但仍然不明白它是如何计算的。谁能帮助我理解这个想法每个 64*64 窗口提取 6*6*31 HOG 特征?本文中的 cellsize、blocksize 和 stride 是多少?
【问题讨论】:
标签: c++ opencv computer-vision feature-extraction