使用值列表对观察空间进行编码（openai gym）答案

【问题标题】：Coding for observation space using a list of values (openai gym)使用值列表对观察空间进行编码（openai gym）
【发布时间】：2025-12-10 11:35:01
【问题描述】：

我有一个元组作为我的观察空间，每个项目对应于该空间的一个动作。

想想一个带有按钮的长面板，它可以有多个离散值，我可以切换其中的任何一个。如果面板有 10 个项目，那么我的操作空间是

self.action_space = space.Discrete(10)

我想要做的是简化我的观察空间，以便我可以提供我的离散值列表。我该如何定义？

PS：我的观察空间目前是一个包含 10 个值（分类）的列表，每个值在其空间内都是不同的。例如，第一个只能取 A 和 B，第二个只能取 C 和 D，以此类推。

【问题讨论】：

【解决方案1】：

您正在寻找Multi Discrete Action Space

【讨论】：