【问题标题】:What is the key feature in MNIST Dataset that is used to classify imagesMNIST 数据集中用于对图像进行分类的关键特征是什么
【发布时间】:2018-04-26 22:51:56
【问题描述】:

我最近在学习神经网络,偶然发现了MNIST 数据集。我知道使用 sigmoid 成本函数来减少损失。此外,权重和偏差会得到调整,并在训练后找到最佳权重和偏差。我不明白的是,图像分类的基础是什么。例如,为了对患者是否患有癌症进行分类,年龄、位置等数据成为特征。在 MNIST 数据集中,我没有找到任何这些。我在这里错过了什么吗?请帮我解决这个问题

【问题讨论】:

  • 可能有不止 一个 MNIST 数据集。但是要准备好看到像素是特征,就像在端到端学习中一样(另外:不一定找到最佳值;理论上的保证在 NN 中并不常见)。

标签: python machine-learning neural-network computer-vision mnist


【解决方案1】:

首先,网络管道由 3 个主要部分组成:

  • 输入操作:
  • 影响找到最小值的参数:
  • 解释中的决策函数等参数 层(通常是全连接层)

与您必须手动提取特征的常规机器学习管道相比,CNN 使用过滤器。 (边缘检测或中提琴和琼斯等过滤器)。

如果过滤器在图像上运行并与像素进行卷积,则它会产生输出。

这个输出然后被一个神经元解释。如果输出高于阈值,则认为它是有效的(如果有效,则 Step 函数计数 1,或者在 Sigmoid 的情况下,它在 sigmoid 函数上有一个值)。

接下来的步骤与之前相同。

这一直持续到解释层(通常是 softmax)。该层解释您的计算(如果过滤器很好地适应您的问题,您将获得良好的预测标签),这意味着您在 (y_guess - y_true_label) 之间的差异很小。

现在您可以看到,对于 y 的猜测,我们将输入 x 与许多权重 w 相乘,并在其上使用了函数。这可以看作是分析中的链式法则。

为了获得更好的结果,必须知道单个权重对输入的影响。因此,您使用反向传播,它是误差关于所有 w 的导数。诀窍是您可以重用或多或少是反向传播的导数,并且由于您可以使用矩阵向量表示法,它变得更容易。

如果你有梯度,你可以使用最小化的正常概念,沿着最陡的下降走。 (还有很多其他的梯度方法,比如 adagrad 或 adam 等)。

这些步骤将重复直到收敛或达到最大时期。

所以答案是:计算的重量(过滤器)是检测数字和数字的关键:)

【讨论】:

    猜你喜欢
    • 2014-03-05
    • 2017-12-02
    • 2011-05-21
    • 2017-12-08
    • 2016-09-16
    • 2018-07-04
    • 2021-01-29
    • 2012-03-13
    • 2021-07-25
    相关资源
    最近更新 更多