【发布时间】:2021-04-08 04:44:00
【问题描述】:
我有如下数据:
| start_date | end_date | project_sales | project_category | project_code |
|---|---|---|---|---|
| 2015-08-03 | 2015-08-06 | 1683 | CatA | 1 |
| 2015-08-02 | 2015-08-04 | 6500 | CatB | 2 |
我想创建一个从日期 2014-01-01 到 2020-12-01 的时间范围,并分配上表的详细信息,例如: 例如在这里,我从 2015-08-02 到 2018-08-06 创建了 date_period df
| date_period | CatA_project_sales | CatB_project_sales | CatA_No_of_projects | CatB_No_of_projects |
|---|---|---|---|---|
| 2015-08-02 | 2166 | 0 | 1 | 0 |
| 2015-08-03 | 2166 | 561 | 1 | 1 |
| 2015-08-04 | 2166 | 561 | 1 | 1 |
| 2015-08-05 | 0 | 561 | 0 | 1 |
| 2015-08-06 | 0 | 561 | 0 | 1 |
正如您在上面看到的,project_sales 除以它的活跃天数。 我对逻辑非常清楚,但我正在努力想出支持它的代码。
感谢任何帮助。
注意:此代码需要在 2014 年 1 月 1 日至 2020 年 12 月 31 日的巨大数据帧上运行,请求帮助时考虑到这一点
【问题讨论】: