【发布时间】:2018-02-05 03:33:39
【问题描述】:
我在 Pandas 中有一个大型数据集,其中的条目标有时间戳。我正在寻找一种解决方案,如何获得具有最高条目出现率的定义长度范围(如 1 分钟)。
一种解决方案可能是将数据重新采样到更高的时间范围(例如一分钟)并比较具有最多值的部分。但是,它只会找到与给定时间范围的开始和结束时间相对应的范围。
我宁愿找到一个解决方案来找到任何 1 分钟范围,无论它们实际从哪里开始。
在下面的示例中,我将寻找 1 分钟的“窗口”,其中条目出现次数最多,从范围内的第一个信号开始,以范围内的最后一个信号结束:
8:50:00
8:50:01
8:50:03
8:55:00
8:59:10
9:00:01
9:00:02
9:00:03
9:00:04
9:05:00
因此我想获得范围 8:59:10 - 9:00:04
任何提示如何做到这一点?
【问题讨论】: