【发布时间】:2012-07-26 16:10:57
【问题描述】:
我正在构建一个模型,在该模型中,公司必须设定价格并做出生产决策。价格是连续的,决策变量也是如此。 (库存、上次销售、价格...)。
我可以使用什么强化学习方法将连续映射到连续? 有哪些 python 包?如果没有 python 包,我可以写一个包装器。
【问题讨论】:
标签: python machine-learning reinforcement-learning economics
我正在构建一个模型,在该模型中,公司必须设定价格并做出生产决策。价格是连续的,决策变量也是如此。 (库存、上次销售、价格...)。
我可以使用什么强化学习方法将连续映射到连续? 有哪些 python 包?如果没有 python 包,我可以写一个包装器。
【问题讨论】:
标签: python machine-learning reinforcement-learning economics
PyBrain 机器学习库是您正在寻找的。这是神经网络的相当复杂的实现,但是当你理解它时,你会得到一个非常强大的工具。
PyBrain 是一个用于神经网络建模的 Python 库。 Overview of the PyBrain 应该给你一个基本的想法:在每个时间戳你为神经网络提供一组连续值并取出另一组连续值。但更重要的是,您可以评估输出并训练您的神经网络。
所有这些步骤(包括网络训练)都已在 PyBrain 中实现。
【讨论】: