【问题标题】:should dqn state values need to be 0 to 1 onlydqn 状态值是否应该仅为 0 到 1
【发布时间】:2020-05-25 11:57:45
【问题描述】:

如果 DQN 中的状态值只需要为 0 到 1,例如 状态 = [0, 0, 0, 1, 1, 1, 1, 0, 1, 0]

或者它可以有一个值大于 1 eh 的状态 状态 = [6, 5, 4, 1, 1, 1, 2, 3, 15, 10]

【问题讨论】:

  • 国家的价值从来没有受到限制,你问这个是什么意思?

标签: python deep-learning reinforcement-learning q-learning dqn


【解决方案1】:

状态本身不需要限制价值。您可以拥有任意大的范围。但出于训练目的,建议将状态值归一化在 [0,1] 范围内,以使使用函数逼近的神经网络不会饱和。

【讨论】: