【发布时间】:2018-07-30 02:33:13
【问题描述】:
我正在使用的包:
- dplyr
- 润滑
我正在使用的起始数据集:
Employee_ID Start_Date End_Date
1 2/1/2013 12/31/9999
2 5/14/2013 10/5/2017
3 9/7/2014 8/30/2017
我希望从起始数据集创建的数据集:
Date Active_Employee_Count
12/31/2013 2
12/31/2014 3
12/31/2015 3
12/31/2016 3
12/31/2017 1
说明
我希望能够在每年的 12 月 31 日获得在职员工的数量。我正在使用 dplyr 和 lubridate 包来尝试做到这一点,但我很挣扎。我知道 filter、group_by、summarise、mutate 和 distinct 函数,但我不确定这些是否足以完成这项任务。我面临的主要挑战是我如何在 12 月 31 日的日期以某种方式进入这个过程?我是否需要创建某种日期数组(2013 年 12 月 31 日、2014 年 12 月 31 日等),然后以某种方式使用它来执行此操作?
【问题讨论】: