【发布时间】:2020-12-19 06:29:15
【问题描述】:
我在这里查看 stackoverflow 帖子:R: Count Number of Observations within a group
在这里,按每月(以及每周)间隔创建和汇总/分组每日数据:
library(xts)
library(dplyr)
#create data
date_decision_made = seq(as.Date("2014/1/1"), as.Date("2016/1/1"),by="day")
date_decision_made <- format(as.Date(date_decision_made), "%Y/%m/%d")
property_damages_in_dollars <- rnorm(731,100,10)
final_data <- data.frame(date_decision_made, property_damages_in_dollars)
# weekly
weekly = final_data %>%
mutate(date_decision_made = as.Date(date_decision_made)) %>%
group_by(week = format(date_decision_made, "%W-%y")) %>%
summarise( total = sum(property_damages_in_dollars, na.rm = TRUE), Count = n())
# monthly
final_data %>%
mutate(date_decision_made = as.Date(date_decision_made)) %>%
group_by(week = format(date_decision_made, "%Y-%m")) %>%
summarise( total = sum(property_damages_in_dollars, na.rm = TRUE), Count = n())
似乎 R (https://www.rdocumentation.org/packages/base/versions/3.6.2/topics/format) 中的“格式”语句被用于指示计算机以某个固定间隔“分组和求和”数据。
我的问题:有没有办法“指示”计算机以不规则的时间间隔“分组和求和”?例如。按 11 天周期,按 3 个月周期,按 2 年周期? (我猜3个月可以写成90天……2年可以写成730天)。
这可能吗?
谢谢
【问题讨论】:
标签: r dplyr group-by sum aggregate