【发布时间】:2021-08-25 08:39:04
【问题描述】:
假设我的数据结构如下:
library('dplyr')
library('lubridate')
set.seed(808)
date <- sample(seq(as.Date('2015/01/01'), as.Date('2020/12/31'), by='day'), 100)
vals <- sample(seq(1, 375), 100)
df <- data.frame(date, vals)
df <- df[order(as.Date(df$date, format='%Y-%m-%d')),]
我知道如何按周分组以及如何对分组数据进行一些计算:
df_agg <- df %>% group_by(week = week(date)) %>% summarise(value = na.omit(mean(vals)))
这将返回一个新的数据框,该数据框有一列“周”,但该列中的数字并不表示它是哪一年的哪一周。所以不是第 1 周、第 2 周、第 3 周...等。我希望每周都有一个唯一的 ID(例如 01-2015 表示 2015 年的第一周)。
我为什么要那个? 我正在处理具有不同时间解决方案的多个数据集,并且我尝试将它们相互结合。有人知道怎么做吗?
【问题讨论】: