【问题标题】:Reinforcement learning methodes that map continuous to continuous将连续映射到连续的强化学习方法
【发布时间】:2012-07-26 16:10:57
【问题描述】:

我正在构建一个模型,在该模型中,公司必须设定价格并做出生产决策。价格是连续的,决策变量也是如此。 (库存、上次销售、价格...)。

我可以使用什么强化学习方法将连续映射到连续? 有哪些 python 包?如果没有 python 包,我可以写一个包装器。

【问题讨论】:

    标签: python machine-learning reinforcement-learning economics


    【解决方案1】:

    PyBrain 机器学习库是您正在寻找的。这是神经网络的相当复杂的实现,但是当你理解它时,你会得到一个非常强大的工具。

    PyBrain 是一个用于神经网络建模的 Python 库。 Overview of the PyBrain 应该给你一个基本的想法:在每个时间戳你为神经网络提供一组连续值并取出另一组连续值。但更重要的是,您可以评估输出并训练您的神经网络。

    所有这些步骤(包括网络训练)都已在 PyBrain 中实现。

    【讨论】:

    • 问题是它的文档很少。你能给我一个提示,我可以用什么来连续到连续?
    猜你喜欢
    • 2019-05-31
    • 2011-10-29
    • 1970-01-01
    • 2018-05-17
    • 1970-01-01
    • 2019-11-05
    • 2016-07-28
    • 1970-01-01
    • 2017-09-27
    相关资源
    最近更新 更多