【发布时间】:2018-06-27 16:26:58
【问题描述】:
我是图像处理的新手,我想提取图像特征以进行一些分类。我在理解管道时遇到问题。
据我了解,我有一张图片,我对它们运行了 SIFT 算法。这给了我一组每个图像的描述符,数量不等,固定长度为 128。
然后我继续对它们进行聚类,因为不可能将算法应用于不同数量的特征。为此,我将所有图像的所有描述符堆叠起来,并使用所需的集群数量运行 k 均值算法。我得到的是 k 个长度为 128 的特征。
这就是我感到困惑的地方,所以我现在有了这些新的描述符,我该怎么处理它们?如果它们代表所有图像,我不明白如何将它们插入分类器?每张图像是否应该有自己独立的特征来输入分类器?
我确定我不理解这个概念,但是任何人都可以澄清一下我得到一个 k*128 大小的矩阵后会发生什么吗?例如,将什么输入到 SVM 分类器以及如何输入?这个 k 表示结果如何足以训练分类器?
谢谢!
编辑:我可能混淆了关键点和描述符,对不起,图像处理新手!
【问题讨论】:
标签: machine-learning computer-vision classification svm sift