【问题标题】:Subsetting data.table set by date range in RR中按日期范围设置的子集data.table
【发布时间】:2014-04-20 15:48:12
【问题描述】:

我在 data.table 中有一个大型数据集,我想按日期范围对其进行子集化。我的数据集如下所示:

testset <- data.table(date=as.Date(c("2013-07-02","2013-08-03","2013-09-04",
                                     "2013-10-05","2013-11-06")), 
                      yr = c(2013,2013,2013,2013,2013), 
                      mo = c(07,08,09,10,11),
                      da = c(02,03,04,05,06), 
                      plant = LETTERS[1:5], 
                      product = as.factor(letters[26:22]), 
                      rating = runif(25))

我希望能够直接从as.Date 列中选择日期范围,而无需使用yrmoda 列。目前,我正在使用mo 进行子集化,有时它非常笨拙,尤其是在年份切换时。一种更优雅的方法可以让我的生活变得无比轻松。

提前致谢!

【问题讨论】:

    标签: r data.table subset date-range slice


    【解决方案1】:

    为什么不:

    testset[date>="2013-08-02" & date<="2013-11-01"]
    

    【讨论】:

      【解决方案2】:

      另见:

      ?`%between%`
      

      像这样工作:

      testset[date %between% c("2013-08-02", "2013-11-01")]
      

      【讨论】:

      • 好点 @scottyaz - 向其他人澄清 %between% 是 data.table 包的一部分。看到 ? 加载包时之间。所以如果你走DT路线,那也不算太大的罪过。
      【解决方案3】:

      你提到你是子集,但不清楚你是否在 R 中使用子集 fn。

      在 R 控制台中键入 ?subset 以查看 R 中的子集()函数的详细信息,该函数“返回满足条件的向量、矩阵或数据帧的子集”。然后使用Troy上面发布的部分方法来选择日期范围

      thisYear <- subset(testset, date > "2015-01-01" & date < "2015-12-31")
      

      【讨论】:

      • 嗨,我收到以下错误:在 Ops.factor(date, "2015-01-01") 中:'>' 对因素没有意义
      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2020-02-06
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多