【发布时间】:2018-04-09 05:13:11
【问题描述】:
我正在处理一个事件数据集。每行都有一个开始时间、一个结束时间和一个值。
看起来像这样:
df = pd.DataFrame({'start': ['2015-01-05 12:21:00', '2015-01-05 18:01:23', '2015-01-05 23:11:01'], 'end': ['2015-01-05 13:18:45', '2015-01-05 21:03:51', '2015-01-05 12:08:11'], 'value': [3, 4, 5]})
end start value
0 2015-01-07 11:18:45 2015-01-07 11:35:00 3
1 2015-01-07 12:08:11 2015-01-07 23:11:01 5
2 2015-01-07 17:03:51 2015-01-07 18:01:23 4
我需要在 10 分钟的常规时间序列中重新采样,如下所示:
time values
1 2015-01-07 11:01:00 NULL
2 2015-01-07 11:11:00 3
3 2015-01-07 11:21:00 3
4 2015-01-07 11:31:00 3
5 2015-01-07 11:41:00 NULL
...
.. 2015-01-07 12:11:00 5
...
.. 2015-01-07 17:01:00 5,4
...
处理这种重新采样的最有效方法是什么?我还强调了最后一个值为“5,4”的多个事件的可能性,处理它的最佳方法是什么?
谢谢!
【问题讨论】:
-
您希望时间从 :01 分钟开始而不是 :00 分钟有什么特别的原因吗?
-
好问题!谢谢你的提问。重采样是因为我需要与其他数据帧合并。他们大多数是00,少数不是。然而,在这两种情况下,建议都是宝贵的!
标签: python pandas time-series