你可以只使用反向传播来教神经网络玩回合制游戏吗？答案

【问题标题】：Can you use just backpropagation to teach a Neural Network to play turn based games?你可以只使用反向传播来教神经网络玩回合制游戏吗？
【发布时间】：2017-06-21 17:29:52
【问题描述】：

我的意思是国际象棋、国际象棋、井字游戏、2048 年、超级马里奥等游戏，在一般游戏中需要多次下棋、移动才能完成。

我很确定可以使用遗传算法，但我很想知道是否有一种方法可以通过纯反向传播来训练它。我会使用什么作为目标值？

我在考虑让他玩一些动作直到游戏结束并使用最终结果作为目标值，但我认为这只会训练最后一个动作，不是吗？

另一种方法是训练每一个动作，但目标值是多少？你可以有多个有效的选择，但从长远来看，肯定有一个更好。如何在不经过我反复试验的情况下选择它？

Backprop 就不能实现吗？

【问题讨论】：

标签： neural-network backpropagation

【解决方案1】：

这绝对是可能的，但您必须提供非常确定的训练数据。您必须生成所有可能的棋盘位置，然后以编程方式找出最适合该位置的移动。例如，您基本上可以使用 minimax 生成所有动作。

做你想做的最好的方法是收集输入：倾向于玩游戏的人类玩家的输出数据，然后你在启用 dropout 的情况下反向传播这些值，以确保网络注意到大模式。

我有一个旧项目，它教神经网络根据你的演奏风格进行学习 (neuraldino)，虽然当时我是神经网络的新手，所以它可能没有那么有效。

【讨论】：