【发布时间】:2013-09-11 07:24:14
【问题描述】:
说明
给定一个包含 10 个序列的数据集 - 一个序列对应于一天的股票价值记录 - 其中每个包含 50 个股票价值的样本记录,从早上或上午 9:05 开始,间隔 5 分钟。但是,有一个额外的记录(第 51 个样本)仅在训练集中可用,它比 50 个样本记录中最后一个记录的样本晚了 2 小时,而不是 5 分钟。第 51 个样本需要在前 50 个样本也给出的测试集中进行预测。
我使用pybrain循环神经网络解决这个问题,将序列组合在一起,每个样本x_i的标签(或通常称为目标y)是下一个时间步的样本@ 987654324@ - 时间序列预测中的典型公式。
示例
A sequence for one day is something like:
Signal id Time value
1 - 9:05 - 23
2 - 9:10 - 31
3 - 9:15 - 24
... - ... - ...
50 - 13:15 - 15
Below is the 2 hour later label 'target' given for the training set
and is required to be predicted for the testing set
51 - 15:15 - 11
问题
现在我的循环神经网络 (RNN) 已经对这 10 个序列进行了训练,如果它遇到另一个序列,我将如何使用 RNN 来预测序列中最后一个样本之后的库存值 2 hours ?
请注意,对于每个训练序列,我也有“比上一个样本股票值晚 2 小时”,但我不确定如何将其纳入训练 RNN,因为它期望样本之间的时间间隔相同。谢谢!
【问题讨论】:
-
我不太明白你的解释。您的所有训练集值是否都包含 50 个输入信号,并且所有样本之间的时间增量相同?您的问题实际上是:
How do you predict the next sequence output吗? -
是的,前 50 个输入信号具有相同的时间增量 - 5 分钟差异,但是,对于每个序列实际上有 51 个输入信号,最后一个信号具有更大的增量 - 2 小时差异 -比其他的,我需要在给定前 50 个信号的情况下预测最后一个信号。所以问题是如何使用与其他信号不同 delta 的信号来训练
RNN,以及如何在给定前 50 个信号的情况下预测该信号。 -
@jorgenkg,我已经更新了问题以澄清,抱歉造成混淆
标签: statistics neural-network time-series prediction pybrain