【问题标题】:Ideal number of HoG featuresHoG 特征的理想数量
【发布时间】:2014-08-11 13:08:39
【问题描述】:

因此,对于如何提取 HoG 特征有很多选择。 使用不同的方向、每个单元格的不同像素数和不同的块大小。

但是是否有标准或最佳配置? 我有大小为 50x100 的训练图像,并且我选择了 8 个方向。我正在从训练数据中提取特征以进行车辆分类。但我真的不知道什么是“最佳”。

例如,我这里有 2 种配置,有什么理由选择其中一种吗?我个人觉得第二个是更好的选择,但为什么呢?

【问题讨论】:

    标签: image-processing classification feature-extraction training-data


    【解决方案1】:

    我使用 HOG 进行产品识别。根据我当时的理解,您指出了标准 HOG 的一个真正问题。根本没有最佳配置,它取决于数据集。如果您有数据集的最佳值,然后调整数据集的所有图片的大小,您也应该调整值的大小。因此,HOG 没有最佳的“一刀切”值。

    但一切都没有丢失。相反,您应该做的是一种“始终”有效的方法。这个想法是做Spatial Pyramid Matching。这只是在各种规模上进行 HOG 并将它们组合在一起。一图胜千言:

    您可以在这里看到,2 级只是带有精细细胞的标准 HOG。但也许它不是最好的尺度(因为单元格太小,你只能观察到噪音)(另一方面,太大的单元格,如 0 级,可能太大,你会在任何地方都有统一的直方图)。当您对数据集进行训练时,您可以计算每个级别的最佳权重,并且您将知道最佳值是什么,即:最相关的单元格大小是多少

    【讨论】:

    • 但是对于一个体验过HoG功能的人,你是否也同意我放的底部图像比顶部图像的HoG比例更好?
    • 从个人经验来看,如果图像不是很小,每个单元格8x8像素通常是不错的配置。和 9 个方向 - UoCTTI 变体。 P. F. Felzenszwalb、R. B. Grishick、D. McAllester 和 D. Ramanan。使用经过判别训练的基于零件的模型进行对象检测。帕米,2009 年。
    • “非常小”是什么意思。我猜 50x100 的图像不会太小?
    • 在我看来,绝对单元格大小无关紧要。另外,我同意底部图像的比例更好,因为您“看到”的对象具有一个单元格(窗户曲率、车轮曲率、门把手等)或几个单元格的比例。顶部的太小了,您会观察到很多噪音。
    • 当你说“在不同的尺度上做 HOG” - 我的意思是,这就是问题对吗?你是怎么做到的?您的意思是您有一个固定 HOG 描述符大小(例如,8x8 单元、2x2 块、一个 HOG 描述符为 128x64 像素),然后只在图像上做一个金字塔?或者你的意思是你保持图像大小相同,但每次都做一个更小的 HOG?)。哪一个?谢谢
    猜你喜欢
    • 2016-05-07
    • 1970-01-01
    • 2012-11-01
    • 2016-04-02
    • 1970-01-01
    • 2014-01-01
    • 1970-01-01
    • 2014-07-14
    • 2016-07-19
    相关资源
    最近更新 更多