HoG 特征的理想数量答案

【问题标题】：Ideal number of HoG featuresHoG 特征的理想数量
【发布时间】：2014-08-11 13:08:39
【问题描述】：

因此，对于如何提取 HoG 特征有很多选择。使用不同的方向、每个单元格的不同像素数和不同的块大小。

但是是否有标准或最佳配置？我有大小为 50x100 的训练图像，并且我选择了 8 个方向。我正在从训练数据中提取特征以进行车辆分类。但我真的不知道什么是“最佳”。

例如，我这里有 2 种配置，有什么理由选择其中一种吗？我个人觉得第二个是更好的选择，但为什么呢？

【问题讨论】：

标签： image-processing classification feature-extraction training-data

【解决方案1】：

我使用 HOG 进行产品识别。根据我当时的理解，您指出了标准 HOG 的一个真正问题。根本没有最佳配置，它取决于数据集。如果您有数据集的最佳值，然后调整数据集的所有图片的大小，您也应该调整值的大小。因此，HOG 没有最佳的“一刀切”值。

但一切都没有丢失。相反，您应该做的是一种“始终”有效的方法。这个想法是做Spatial Pyramid Matching。这只是在各种规模上进行 HOG 并将它们组合在一起。一图胜千言：

您可以在这里看到，2 级只是带有精细细胞的标准 HOG。但也许它不是最好的尺度（因为单元格太小，你只能观察到噪音）（另一方面，太大的单元格，如 0 级，可能太大，你会在任何地方都有统一的直方图）。当您对数据集进行训练时，您可以计算每个级别的最佳权重，并且您将知道最佳值是什么，即：最相关的单元格大小是多少

【讨论】：

但是对于一个体验过HoG功能的人，你是否也同意我放的底部图像比顶部图像的HoG比例更好？
从个人经验来看，如果图像不是很小，每个单元格8x8像素通常是不错的配置。和 9 个方向 - UoCTTI 变体。 P. F. Felzenszwalb、R. B. Grishick、D. McAllester 和 D. Ramanan。使用经过判别训练的基于零件的模型进行对象检测。帕米，2009 年。
“非常小”是什么意思。我猜 50x100 的图像不会太小？
在我看来，绝对单元格大小无关紧要。另外，我同意底部图像的比例更好，因为您“看到”的对象具有一个单元格（窗户曲率、车轮曲率、门把手等）或几个单元格的比例。顶部的太小了，您会观察到很多噪音。
当你说“在不同的尺度上做 HOG” - 我的意思是，这就是问题对吗？你是怎么做到的？您的意思是您有一个固定 HOG 描述符大小（例如，8x8 单元、2x2 块、一个 HOG 描述符为 128x64 像素），然后只在图像上做一个金字塔？或者你的意思是你保持图像大小相同，但每次都做一个更小的 HOG？）。哪一个？谢谢