【发布时间】:2014-12-10 19:21:10
【问题描述】:
我有一个包含大量观察的数据集,其中包含 3 个不同的字段:
Consumption, Date, Hour
100, 17/12/2010, 00
120, 17/12/2010, 01
105, 17/12/2010, 02
110, 17/12/2010, 03
...
140, 17/12/2010, 23
130, 18/12/2010, 00
145, 18/12/2010, 01
...
我想要实现的是创建一个包含这 3 个字段的新数据集:
Consumption, Date, Period
103.5, 17/12/2010, Night
104.9, 17/12/2010, Morning
104.9, 17/12/2010, Afternoon
所以每天 00-08 小时之间的所有观察都属于夜间,08-16 属于上午,16-23 属于下午。我的新数据集的字段消耗将存储相应时间之间观察值的平均值。所以最后,我希望每天只观察 3 次,而不是现在的 24 次。 我想我可以使用 aggregate() 函数来实现这一点,但我不知道如何正确使用它来实现它。我在寻找正确的方向吗?如何才能做到这一点?
【问题讨论】: