【发布时间】:2020-05-21 15:12:21
【问题描述】:
我有一个包含 10 家医院的虚拟数据集,其中记录了该医院在特定日期有多少工作。这些日期是每周进行的,缺少日期意味着该周有 0 个工作。
set.seed(2020)
df1 <- data.frame(
Date = as.Date(sample( as.numeric(as.Date('2011-01-01')): as.numeric(as.Date('2013-04-14')), 10, replace = T), origin = '1970-01-01'),
Hospital = sample(1:10,replace=T),
Jobs = rpois(10,2))
我想填写每家医院的缺失日期(每周拍摄),因此每家医院有 120 个条目(因为 2011-01-01 和 2013-04-14 之间有 120 周),其中为新日期分配了 0 的“工作”变量。因此输出一个包含 1200 行的数据框(10 家医院,每个医院有 120 周的条目)。
注意:我尝试了一个解决方案:R fill missing dates by category,但它只填充数据中已经存在的最小值和最大值之间的缺失日期,而不是上面定义的日期。我还尝试将开始和结束日期手动添加到每个医院的数据中,应用解决方案,然后再次删除它们,但这不能按预期工作。
【问题讨论】: