将连续映射到连续的强化学习方法

【问题标题】：Reinforcement learning methodes that map continuous to continuous将连续映射到连续的强化学习方法
【发布时间】：2012-07-26 16:10:57
【问题描述】：

我正在构建一个模型，在该模型中，公司必须设定价格并做出生产决策。价格是连续的，决策变量也是如此。（库存、上次销售、价格...）。

我可以使用什么强化学习方法将连续映射到连续？有哪些 python 包？如果没有 python 包，我可以写一个包装器。

【问题讨论】：

【解决方案1】：

PyBrain 机器学习库是您正在寻找的。这是神经网络的相当复杂的实现，但是当你理解它时，你会得到一个非常强大的工具。

PyBrain 是一个用于神经网络建模的 Python 库。 Overview of the PyBrain 应该给你一个基本的想法：在每个时间戳你为神经网络提供一组连续值并取出另一组连续值。但更重要的是，您可以评估输出并训练您的神经网络。

所有这些步骤（包括网络训练）都已在 PyBrain 中实现。

【讨论】：