【发布时间】:2020-10-13 19:06:51
【问题描述】:
我正在创建一个 CNN,以根据测量的光谱 (2D) 预测应用于光纤的分布应变,这在理想情况下是洛伦兹曲线。标签是一维数组,其中只有应变部分不为零(标签看起来像方波)。
我的 CNN 有 10 个交替卷积和池化层,全部由 RelU 激活。然后是 3 个带有 softmax 激活的全连接隐藏层,然后是由 RelU 激活的输出层。通常,CNN 和其他神经网络将 RelU 用于隐藏层,然后将 softmax 用于输出层(在分类问题的情况下)。但在这种情况下,我使用 softmax 首先确定施加应变的光纤的位置(即非零),然后在输出中使用 RelU 进行回归。我的 CNN 能够相当准确地预测标签,但我找不到任何支持出版物,其中在隐藏层中使用了 softmax,在输出层中使用了 RelU;除了我在 Quora/Stackoverflow 中找到的方法之外,为什么不推荐这种方法(即在数学上不可行)。如果有人能在这件事上给我启发,我将不胜感激,因为我对深度学习还很陌生,并希望从中学习。提前谢谢!
【问题讨论】:
标签: python keras deep-learning conv-neural-network activation