【发布时间】:2012-08-16 00:15:55
【问题描述】:
我两周前开始学习,现在有点卡住了。我有 2 个 TimeSeries,看起来像这样:
2011-01-09 00:00:00+00:00 7.430126
2011-01-09 01:00:00+00:00 6.793855
2011-01-09 02:00:00+00:00 6.675949
2011-01-09 03:00:00+00:00 6.756636
2011-01-09 04:00:00+00:00 6.875174
2011-01-09 05:00:00+00:00 5.432611
2011-01-09 06:00:00+00:00 6.059197
2011-01-09 21:00:00+00:00 5.338928
2011-01-09 22:00:00+00:00 5.259672
2011-01-09 23:00:00+00:00 5.247196
2011-01-10 00:00:00+00:00 5.889274
2011-01-10 01:00:00+00:00 6.133871
2011-01-10 02:00:00+00:00 6.111958
2011-01-10 03:00:00+00:00 5.873732
2011-01-10 04:00:00+00:00 5.627684
2011-01-10 05:00:00+00:00 5.265644
2011-01-10 06:00:00+00:00 5.505559
2011-01-10 21:00:00+00:00 3.835050
2011-01-10 22:00:00+00:00 3.879653
2011-01-10 23:00:00+00:00 4.034543
2011-01-11 00:00:00+00:00 4.844272
2011-01-11 01:00:00+00:00 4.670967
2011-01-11 02:00:00+00:00 4.584164
2011-01-11 03:00:00+00:00 4.786821
这是风速测量数据,我想将其与模型数据进行比较。更具体地说,我想比较夜间(21.00 - 6.00)的风速。所以我定义了一个函数:
def func(model, measure):
return (model-measure).mean()
另外,我在数据上创建了一个循环:
mean_night = []
start = 7
for a in night:
mean_night.append(func(model, measure[start:(start+10)]))
start = start+11
if start>5378:
break
问题是我丢失了时间索引并且丢失了一些数据(例如 1 天或 1 周),因此我无法使用 DateRange 重新索引它。最后应该是这样的:
date difference_means
2011-01-09 diff_1
2011-01-09 diff_2
等等。我使用熊猫 0.7.1。谢谢你的支持! (对不起我的英语不好:P)
【问题讨论】:
-
只是为了确保我遵循 - 您希望您的输出是每个夜间时间的时间戳,但要让数据成为该测量值与平均值的距离或距离平均值的距离上一行的值?
-
你为什么不创建一个包含
date、mean字段的类?甚至只是将信息存储为元组;即mean_night.append((date, func(...)))?然后你就不用担心索引了。 -
@IamChuckB 我想知道从 2011 年 1 月 9 日到 2012 年 6 月 30 日每晚的模型数据和实际值之间的差异。我的数据如上所示,问题是我丢失了时间戳。
标签: python time html pandas mean