dqn 状态值是否应该仅为 0 到 1

【问题标题】：should dqn state values need to be 0 to 1 onlydqn 状态值是否应该仅为 0 到 1
【发布时间】：2026-02-07 04:30:01
【问题描述】：

如果 DQN 中的状态值只需要为 0 到 1，例如状态 = [0, 0, 0, 1, 1, 1, 1, 0, 1, 0]

或者它可以有一个值大于 1 eh 的状态状态 = [6, 5, 4, 1, 1, 1, 2, 3, 15, 10]

【问题讨论】：

国家的价值从来没有受到限制，你问这个是什么意思？

标签： python deep-learning reinforcement-learning q-learning dqn

【解决方案1】：

状态本身不需要限制价值。您可以拥有任意大的范围。但出于训练目的，建议将状态值归一化在 [0,1] 范围内，以使使用函数逼近的神经网络不会饱和。

【讨论】：

猜你喜欢

在 Okta 中 SP 发起的 SAML 的中继状态值应该是多少？ 2026-02-04
我应该使用`删除数组[x]; array.length-=1` 而不是`array.splice(x,1)`？ 2026-01-22
线性回归预测中的值错误：“ValueError：形状（1,1）和（132,132）未对齐：1（dim 1）！= 132（dim 0）” 2026-01-22
Firefox 49.0.2 附加组件的 XMLHttpRequest 状态 0 2026-02-08
使用单例 PixelShader 是否应该是最佳实践？ 2026-02-04
React Redux：reducers 是否应该包含任何逻辑 2026-01-31
Chisel 是否应该生成 verilog 测试台逻辑？ 2026-01-18
测试括号是否平衡， (a{[]b({})}c)[] 返回 false，但应该为 true 2026-01-06
tabindex 为 0 的元素到 tabindex 为 1+ 的下一个元素没有聚焦 2026-02-04

相关资源

Phpwind点卡充值即时到账积分插件 v1.0.0下载 2023-03-15
linux下system返回值中文WORD版下载 2022-12-01
纯js响应式模态窗口和弹出层特效插件MODALit下载 2023-01-22
Qiwar {tuz 1} Regular字体,Qiwar {tuz 1}字体下载下载 2022-12-18
Bundesbahn Pi Std 1 Regular字体,BundesbahnPiStd-1字体下载下载 2022-12-17

最近更新更多

热门标签

Java Python linux javascript C# Mysql Docker 算法前端 SpringBoot Redis Vue spring .net 设计模式 .net core c++ kubernetes 数据库机器学习大数据数据结构微服务 js 人工智能 Go Android 面试程序员 JVM 云原生后端 ASP.net core 深度学习 CSS k8s git golang PHP devops Nginx Django React mybatis 架构多线程 Spring Boot 云计算 LeetCode 分布式