【问题标题】:Can you use just backpropagation to teach a Neural Network to play turn based games?你可以只使用反向传播来教神经网络玩回合制游戏吗?
【发布时间】:2017-06-21 17:29:52
【问题描述】:

我的意思是国际象棋、国际象棋、井字游戏、2048 年、超级马里奥等游戏,在一般游戏中需要多次下棋、移动才能完成。

我很确定可以使用遗传算法,但我很想知道是否有一种方法可以通过纯反向传播来训练它。我会使用什么作为目标值?

我在考虑让他玩一些动作直到游戏结束并使用最终结果作为目标值,但我认为这只会训练最后一个动作,不是吗?

另一种方法是训练每一个动作,但目标值是多少?你可以有多个有效的选择,但从长远来看,肯定有一个更好。如何在不经过我反复试验的情况下选择它?

Backprop 就不能实现吗?

【问题讨论】:

    标签: neural-network backpropagation


    【解决方案1】:

    这绝对是可能的,但您必须提供非常确定的训练数据。您必须生成所有可能的棋盘位置,然后以编程方式找出最适合该位置的移动。例如,您基本上可以使用 minimax 生成所有动作。

    做你想做的最好的方法是收集输入:倾向于玩游戏的人类玩家的输出数据,然后你在启用 dropout 的情况下反向传播这些值,以确保网络注意到大模式。

    我有一个旧项目,它教神经网络根据你的演奏风格进行学习 (neuraldino),虽然当时我是神经网络的新手,所以它可能没有那么有效。

    【讨论】:

      猜你喜欢
      • 2016-04-05
      • 2020-04-03
      • 2015-03-03
      • 2012-02-21
      • 2011-01-05
      • 1970-01-01
      • 1970-01-01
      • 2013-04-26
      相关资源
      最近更新 更多