【发布时间】:2020-01-24 12:24:03
【问题描述】:
这个问题没有代码示例,我正在寻找如何做到这一点的方法。
想象一个神经网络试图学习一个游戏,它有 4 个可能的输出(它可以做的动作)。
如果其他玩家在神经网络的(坏)移动后获胜或获得优势,您可能需要进行反向传播以教它不要进行此移动。因此,您希望将数据 [?, 0, ?, ?] 输入到成本函数中。 ...但是因为任何其他动作可能没问题或可能不是我没有为其他动作输入的值。 [1, 0, 1, 1] 不是我想要的。
如何仅对 1 个输出进行反向传播? DeepLearning4J 是否适合这种情况?
感谢您的帮助!
R.
【问题讨论】:
标签: neural-network backpropagation deeplearning4j