【发布时间】:2018-12-19 17:25:18
【问题描述】:
我想使用诸如一年中的星期、星期几、季节等特征来构建时间序列预测模型。
由于预测会受到最新值的高度影响,我想使用过去 5 天的值作为特征,但是我在为学习准备数据时遇到了问题:
我当前的表格如下所示:
date id score
0 2014-01-01 A 75
1 2014-01-01 B 1
2 2014-01-01 C 2
4 2014-01-02 A 84
5 2014-01-02 B 1
6 2014-01-02 C 3
8 2014-01-03 A 1
9 2014-01-03 B 1
10 2014-01-03 C 1
所以我希望每一行看起来像这样:
date id score date_1 date_2 date_3 date_4 date-5
10 2014-01-03 A 1 84 75 0 0 0
9 2014-01-03 B 1 1 1 0 0 0
Date_1 是 A 的分数,它的日期在 'date' 列的前一天,date_2 是前两天,依此类推...
这样我就可以使用过去 5 天的信息以及与此问题无关的更多特征来预测第二天。 用 0 填充 NaN 值是可以的
【问题讨论】:
标签: python pandas date group-by row