【发布时间】:2019-08-16 00:12:47
【问题描述】:
我有一个 data.frame,我想在其中创建一个新列,对样本的来源时间段进行分类。每个时期从 8 月 1 日开始,到 7 月 31 日结束。例如,期间 1 为 2001 年 8 月 1 日至 2002 年 7 月 31 日,期间 2 为 2002 年 8 月 1 日至 2003 年 7 月 31 日
我一直在尝试使用 dplyr,因为我想要一个整洁的解决方案。
以下是data.frame的示例
Date <- seq(as.Date("2001/08/01"), by = "month", length.out = 60)
AHD <- rnorm(60, mean = 12, sd = 1)
df <- data.frame(Date=Date, AHD = AHD)
我可以使用以下方法将 data.frame 子集到其中一个周期中:
df %>%
group_by(dr = cut(Date, breaks = c(range(Date),
as.Date(c("2001-08-01", "2002-07-31"))), include.lowest=TRUE) )
但是,我不知道如何在一系列期间执行此操作,也不知道如何构建新的类别列。我需要一个新列来说明每一行是否属于周期 1、周期 2 等。
【问题讨论】: