【发布时间】:2021-05-15 01:12:33
【问题描述】:
我有一个包含一系列日期的数据集,需要在新行中填写缺失的日期。 df1 是我正在使用的数据的一个例子,df2 是我设法实现的一个例子(我被卡住了)。 df3 是我想结束的地方!
df1
ID Date DateStart DateEnd
1 2/11/2021 2/11/2021 2/17/2021
1 2/19/2021 2/19/2021 2/21/2021
2 1/15/2021 1/15/2021 1/20/2021
2 1/22/2021 1/22/2021 1/23/2021
这就是我所在的地方。 NA 不是问题,因为我打算在完成我需要做的事情后删除 DateStart 和 DateEnd 列。这里的问题是我不想包含之前 DateStart 和 DateEnd 范围内的日期。
为了到达这里,我按 ID 分组并填写了df1 中日期之间的缺失日期:
df2
ID Date DateStart DateEnd
1 2/11/2021 2/11/2021 2/17/2021
1 2/12/2021 NA NA
1 2/13/2021 NA NA
1 2/14/2021 NA NA
1 2/15/2021 NA NA
1 2/16/2021 NA NA
1 2/17/2021 NA NA
1 2/18/2021 NA NA
1 2/19/2021 2/19/2021 2/21/2021
2 1/15/2021 1/15/2021 1/20/2021
2 1/16/2021 NA NA
2 1/17/2021 NA NA
2 1/18/2021 NA NA
2 1/19/2021 NA NA
2 1/20/2021 NA NA
2 1/21/2021 NA NA
2 1/22/2021 NA NA
2 1/23/2021 1/23/2021 1/24/2021
这实际上是我想要的结果:
df3
ID Date DateStart DateEnd
1 2/11/2021 2/11/2021 2/17/2021
1 2/18/2021 NA NA
1 2/19/2021 2/19/2021 2/21/2021
2 1/15/2021 1/15/2021 1/20/2021
2 1/21/2021 NA NA
2 1/22/2021 NA NA
2 1/23/2021 1/23/2021 1/24/2021
在df3 中填写了缺失的日期,但未填写 DateStart-DateEnd 范围内的日期。
关于如何实现这一目标的任何想法?注意:我有一个包含大量观察的数据集。
【问题讨论】:
-
在
df1中,最后 3 个日期是 1/22/2021,1/22/2021, 1/23/2021 。在df3中,它们是 1/23/2021、1/23/2021、1/24/2021。
标签: r date range tidyverse fill