【发布时间】:2021-08-26 12:50:03
【问题描述】:
我有以下格式的数据:
BEG_DT END_DT REGION
0 2020-01-01 2021-06-09 region_a
1 2020-06-29 2021-06-09 region_a
2 2020-01-01 2020-06-29 region_a
3 2020-01-01 2021-06-09 region_b
4 2020-01-01 2021-06-09 region_b
5 2020-01-01 2021-06-09 region_a
6 2020-01-01 2021-06-09 region_a
7 2020-07-08 2021-06-09 region_a
8 2020-01-01 2020-07-08 region_a
9 2021-05-10 2021-06-09 region_a
10 2020-01-01 2021-05-10 region_a
11 2020-01-01 2021-06-09 region_a
12 2020-01-01 2021-06-09 region_a
13 2020-01-01 2021-06-09 region_a
14 2020-01-01 2021-06-09 region_a
15 2020-01-01 2021-06-09 region_a
16 2020-01-01 2021-06-09 region_a
17 2020-01-01 2021-06-09 region_b
18 2020-01-01 2021-06-09 region_a
19 2020-02-10 2021-06-09 region_a
20 2020-01-01 2020-02-10 region_a
21 2020-01-01 2021-06-09 region_a
22 2020-01-01 2021-06-09 region_b
23 2020-01-01 2021-06-09 region_a
24 2020-05-31 2021-06-09 region_b
25 2020-01-01 2020-05-31 region_b
26 2020-07-31 2021-06-09 region_a
27 2020-03-01 2020-07-31 region_a
28 2020-01-01 2020-03-01 region_a
29 2021-03-08 2021-06-09 region_a
30 2020-03-31 2021-03-08 region_a
31 2020-01-01 2020-03-31 region_a
32 2020-01-01 2021-06-09 region_a
33 2020-01-01 2021-06-09 region_a
34 2020-12-31 2021-06-09 region_a
35 2020-01-01 2020-12-31 region_a
36 2020-01-01 2021-06-09 region_a
37 2021-03-17 2021-06-09 region_a
38 2020-01-01 2021-03-17 region_a
39 2020-01-01 2021-06-09 region_a
40 2021-03-31 2021-06-09 region_b
41 2020-01-01 2021-03-31 region_b
42 2020-01-01 2021-06-09 region_a
43 2020-05-31 2021-06-09 region_b
44 2020-01-01 2020-05-31 region_b
45 2021-05-08 2021-06-09 region_c
46 2021-03-31 2021-05-08 region_c
47 2020-12-31 2021-03-31 region_c
48 2020-01-01 2020-12-31 region_a
49 2020-01-01 2021-06-09 region_a
每一行代表给定 id 在给定区域中存在的持续时间。
如何从日期范围转换为时间序列?
应将日期范围重新采样到单个时间序列索引中。
REGION 列应转为三列('region_a'、'region_b'、'region_c')
这些值应该是新索引位于原始记录的 BEG_DT 和 END_DT 之间的记录数。
region_b region_a region_c
2020-01-01 9000 8000 1000
2020-01-02 8940 7932 1128
...
2021-06-09 8067 7062 2871
【问题讨论】:
标签: python pandas time-series pandas-groupby