【发布时间】:2018-09-04 21:37:51
【问题描述】:
实际上,我的情况非常混乱。我有 60 个单表,其中包含 2009-01-01 到 2017-09-30 日期之间的数据。但是这些值并不是每天都连续的。在几个表中或以三天为间隔,每月有一天的数据。有时每个月的每一天都有一个值。
我想找出每年哪个日期的数据频率最高。之后我需要这个进行插值。
我的想法:我建立了一个数据框,第一列是从 2009-01-01 到 2017-09-30 连续的日期。现在我想用 60 个数据不连续的表来填充这个数据框。
我需要一个代码来将数据与data frame WholeData 中的正确日期匹配(参见示例)。而且我不再需要单个表的日期,因为它已经在第一列中。
示例代码简化:
df1 <- sample(seq(as.Date('2009-01-01'), as.Date('2009-09-30'), by = "day"),
12)
df1 <- sort(df1)
expenses1 <- sample(180, 12)
df1 <- data.frame(df1, expenses1)
df2 <- sample(seq(as.Date('2009-01-01'), as.Date('2009-09-30'), by = "day"),
12)
df2 <- sort(df2)
expenses2 <- sample(180, 12)
df2 <- data.frame(df2, expenses2)
WholeData <- seq(as.Date("2009-01-01"), by = 1, as.Date("2009-09-30"))
df <- data.frame(WholeData)
df1 和 df2 代表我的 60 张凌乱的桌子。时间间隔也缩短了。
【问题讨论】:
-
看看
dplyr::join_all
标签: r