MNIST 数据集中用于对图像进行分类的关键特征是什么答案

【问题标题】：What is the key feature in MNIST Dataset that is used to classify imagesMNIST 数据集中用于对图像进行分类的关键特征是什么
【发布时间】：2018-04-26 22:51:56
【问题描述】：

我最近在学习神经网络，偶然发现了MNIST 数据集。我知道使用 sigmoid 成本函数来减少损失。此外，权重和偏差会得到调整，并在训练后找到最佳权重和偏差。我不明白的是，图像分类的基础是什么。例如，为了对患者是否患有癌症进行分类，年龄、位置等数据成为特征。在 MNIST 数据集中，我没有找到任何这些。我在这里错过了什么吗？请帮我解决这个问题

【问题讨论】：

可能有不止一个 MNIST 数据集。但是要准备好看到像素是特征，就像在端到端学习中一样（另外：不一定找到最佳值；理论上的保证在 NN 中并不常见）。
你应该通过这个cs231n.github.io/convolutional-networks

标签： python machine-learning neural-network computer-vision mnist

【解决方案1】：

首先，网络管道由 3 个主要部分组成：

输入操作：
影响找到最小值的参数：
解释中的决策函数等参数层（通常是全连接层）

与您必须手动提取特征的常规机器学习管道相比，CNN 使用过滤器。（边缘检测或中提琴和琼斯等过滤器）。

如果过滤器在图像上运行并与像素进行卷积，则它会产生输出。

这个输出然后被一个神经元解释。如果输出高于阈值，则认为它是有效的（如果有效，则 Step 函数计数 1，或者在 Sigmoid 的情况下，它在 sigmoid 函数上有一个值）。

接下来的步骤与之前相同。

这一直持续到解释层（通常是 softmax）。该层解释您的计算（如果过滤器很好地适应您的问题，您将获得良好的预测标签），这意味着您在 (y_guess - y_true_label) 之间的差异很小。

现在您可以看到，对于 y 的猜测，我们将输入 x 与许多权重 w 相乘，并在其上使用了函数。这可以看作是分析中的链式法则。

为了获得更好的结果，必须知道单个权重对输入的影响。因此，您使用反向传播，它是误差关于所有 w 的导数。诀窍是您可以重用或多或少是反向传播的导数，并且由于您可以使用矩阵向量表示法，它变得更容易。

如果你有梯度，你可以使用最小化的正常概念，沿着最陡的下降走。（还有很多其他的梯度方法，比如 adagrad 或 adam 等）。

这些步骤将重复直到收敛或达到最大时期。

所以答案是：计算的重量（过滤器）是检测数字和数字的关键:)

【讨论】：