【发布时间】:2016-04-08 22:03:57
【问题描述】:
我有一个这样的熊猫数据框
2011-5-5 12:43 noEvent CarA otherColumns...
2011-5-5 12:45 noEvent CarA ...
2011-5-5 12:49 EVENT CarA ...
2011-5-5 12:51 noEvent CarA ...
(no data - jumps in time)
2011-5-6 12:52 EVENT CarA ...
2011-5-6 12:59 noEvent CarA ...
2011-5-6 13:00 noEvent CarA ...
2011-5-5 12:43 noEvent CarB ...
2011-5-5 12:45 noEvent CarB ...
2011-5-5 12:49 noEvent CarB ...
2011-5-5 12:51 noEvent CarB ...
(no data - jumps in time)
2011-5-6 12:52 noEvent CarB ...
2011-5-6 12:52 EVENT CarB ...
2011-5-6 13:00 noEvent CarB ...
解释:
- 时间戳列不是线性间隔的
- 有 2 辆车,A 和 B。来自 A 的事件独立于 B 的事件
我需要在事件发生前后+-2 分钟针对每辆车执行一些计算。
为此,我很困惑...如何过滤此数据框?
想要的结果应该是这样的
-2min
2011-5-5 12:49 EVENT CarA ...
+2min
-2min
2011-5-6 12:52 EVENT CarA ...
+2min
-2min
2011-5-6 12:52 EVENT CarB ...
+2min
一些信息:
- 您不能混合来自 CarA 和 CarB 的事件
- 未来汽车的数量可能会达到数十万辆
我不知道从哪里开始..
- 我可以使用哪些功能?
- 如何将事件分组到“块”中,以便分别处理每 4 分钟的记录块?
【问题讨论】: