【发布时间】:2019-02-14 14:22:37
【问题描述】:
您好,我正在开展一个对对象进行分类的项目。我在这个项目中使用了 MLP,它可以从 10 个不同的对象中分类一个对象。但是我的准确率在 %50 左右。我想改进它,我使用 500.000 张图像作为数据集,因此绰绰有余。现在我使用原始图像作为输入。这个项目合适的特征提取方法是什么?
【问题讨论】:
您好,我正在开展一个对对象进行分类的项目。我在这个项目中使用了 MLP,它可以从 10 个不同的对象中分类一个对象。但是我的准确率在 %50 左右。我想改进它,我使用 500.000 张图像作为数据集,因此绰绰有余。现在我使用原始图像作为输入。这个项目合适的特征提取方法是什么?
【问题讨论】:
准确率低可能与特征提取本身有关,也可能无关。没有它我认为你的准确性仍然很低,我认为这也与训练或其他部分有关。我不能具体,因为你没有提供任何细节。同样对于 CIFAR-10,我相信您使用的是 toronto.edu 的数据集,它有 50.000 张图像而不是 500.000 张。只是为了防止混淆。 无论如何,对于您的问题,有很多特征提取方法,但我会使用 Canny Edge Detector。步骤:F
-最后一步:Canny 边缘检测。 Canny 边缘检测器通常将灰度图像作为输入,并创建一个输出图像来显示不连续性的强度位置。Canny 边缘检测器所做的第一件事是它使用高斯卷积来平滑输入图像并去除噪音。然后,将一阶导数算子应用于平滑后的图像,以选择图像中具有高一阶空间导数的区域。算法的下一步是通过计算 x 导数和 y 导数来找到梯度的大小和方向,梯度的这些方向允许我们找到边缘的方向。在找到梯度方向后,canny 边缘检测器执行非最大抑制,这意味着它跟踪从边缘上升的脊的顶点,并通过生成细线将这些脊设置为零。换句话说,我们检查计算的梯度在正负梯度方向的相邻点中是否最大。如果梯度最大,则将其视为边缘的一部分,反之亦然。
总结使用 RBG to GREY、Median Filter 和 Canny Edge Detector。请注意,对于普通计算机,此过程可能需要 5 分钟以上才能处理 50.000 张图像。所以要有耐心。 亲切的问候。
【讨论】:
您是否考虑过在这个项目中使用卷积神经网络?与 MLP 相比,CNN 在图像分类方面要优越得多。 https://machinelearningmastery.com/when-to-use-mlp-cnn-and-rnn-neural-networks/
【讨论】: