【发布时间】:2014-06-03 13:25:09
【问题描述】:
在 ImageNet Classification with Deep Convolutional 等论文中 神经网络
http://www.cs.toronto.edu/~fritz/absps/imagenet.pdf
训练方法似乎是带有随机梯度下降的基本反向传播。
尽管 CNN 是深度神经网络的一部分,但这纯粹是因为存在大量隐藏层吗?这是否意味着这里的反向传播属于深度学习的范畴,因为网络很深,即使它不遵循与使用贪婪层明智训练(一种真正的深度学习技术)的 DBN 之类的模式相同的模式?
感谢您的帮助和建议。
【问题讨论】:
-
这被称为深度,因为隐藏层的数量比它的祖先多。它们是成功的,因为人们找到了更多方法来处理更深的 NN 模型(ReLU、Dropout、Maxout、响应归一化......)的梯度递减问题。由于 GPU,它们是可行的。
-
@Erogol 你知道最近有什么总结论文描述了那些解决梯度递减问题的技术吗?
标签: machine-learning artificial-intelligence neural-network convolution deep-learning