【发布时间】:2018-09-29 22:48:54
【问题描述】:
我正在从头开始编写一个多层感知器,只有一个输入层、隐藏层和输出层。输出层会使用 softmax 激活函数来产生多个互斥输出的概率。
在我的隐藏层中,使用 softmax 激活函数对我来说也没有意义 - 这是正确的吗?如果是这样,我可以只使用任何其他非线性激活函数,例如 sigmoid 或 tanh 吗?或者我什至可以不在隐藏层中使用任何激活函数,而只是将隐藏节点的值保持为输入节点和输入到隐藏权重的线性组合?
【问题讨论】:
标签: machine-learning neural-network classification softmax activation-function