【发布时间】:2024-01-24 03:02:01
【问题描述】:
我想了解Deep MNIST for Experts。我对神经网络和深度学习如何在高水平上工作有一个非常清晰的概念,但我很难理解细节。
在教程中首先编写并运行一个简单的单层模型。这包括定义模型 x*W+b、计算熵、通过梯度下降最小化熵和评估结果。
我发现第一部分很容易运行和理解。
在第二部分中,构建一个简单的多级网络,并应用一些卷积和池化。然而,这里的事情开始变得棘手。他们写道:
我们现在可以实现我们的第一层。它将由卷积组成,然后是最大池化。卷积将为每个 5x5 补丁计算 32 个特征。
一个 5x5 的补丁应该等于 25 像素。对?为什么要从 25 个像素中提取 32 个特征?为什么你想要比数据点更多的特性?这有什么意义呢?感觉就像他们正在将问题从 25 维“升级”到 32 维。感觉 32 个维度中的 7 个应该是多余的。
其次。卷积使用函数truncated_normal,它只选择接近均值的随机值。为什么这是一个很好的手写数字建模模型?
第三。网络中的第二层似乎又在做同样的事情。层数越多越好吗?单层可以达到同样的效果吗?
【问题讨论】:
-
本教程假定您了解卷积网络。我认为首先阅读 CN 模型会简化您的探索。在那里,您会发现特征是图像中的特征。每个特征都适用于完整的图像(特征图),因此它并不是真正的放大。它以不同的方式“看”图像。请注意,我怀疑这是一个 SO 问题,因此我没有发布完整的答案。也许像尼尔森的书这样的论坛或资源可以提供帮助。
-
这对于 Data Science SE 或 CV 来说也是一个更合适的问题。此外,对于所有相关方,每个问题一个问题比三合一问题更可取。它将帮助未来的读者更轻松地找到他们需要的帖子,它不会让想要帮助您的人不知所措,并且它会为您提供更多答案,因为它可以避免排除对您的 3 个问题中的 1 个或 2 个问题有答案的人。
-
我投票结束这个问题,因为它属于 Data Science SE
标签: machine-learning neural-network tensorflow deep-learning