【发布时间】:2021-12-20 10:00:26
【问题描述】:
我在 pandas 数据框中有一些时间序列数据,如下所示:
| begin | end | mw_values |
|---|---|---|
| 2021-09-14 11:16:00 | 2021-09-14 11:27:11 | 0 |
| 2021-09-14 11:27:11 | 2021-09-14 11:30:00 | 100 |
| 2021-09-14 11:30:00 | 2021-09-14 11:33:59 | 1200 |
| 2021-09-14 11:33:59 | 2021-09-14 11:39:42 | 600 |
| 2021-09-14 11:39:42 | 2021-09-14 11:59:59 | 400 |
我需要将 mw_values 的总和分配到 15 分钟的时间段中,如下所示:
| time_slots_15_min | sum_mw_values |
|---|---|
| 2021-09-14 11:00 | 0 |
| 2021-09-14 11:15 | 100 |
| 2021-09-14 11:30 | 2200 |
| 2021-09-14 11:45 | 0 |
| 2021-09-14 12:00 | 0 |
有人知道我如何实现这一目标吗?
请注意,开始和结束之间的间隔可能会重叠 2 个时隙。那么该值必须包含在它开始的时隙的总和中;例如上面示例中的 mw_value 为 400。
【问题讨论】:
-
“最终”值真的相关吗?
-
@Riley 看起来只有开始值很重要。两个答案都按
"begin"列重新索引,然后重新采样
标签: python pandas time-series rolling-computation pandas-resample