【发布时间】:2020-10-09 04:24:50
【问题描述】:
我正在处理一个包含 35 个变量的数据集。我已经导出了年龄虚拟变量类别,以将患者的年龄分为不同的年龄组。现在我想根据日期和位置变量汇总每个年龄段的病例总数和病例数。以下是我尝试过的代码,但是我没有得到每个年龄段的案例值的总和。例如,如果总共有 10 个病例,那么这 10 个病例应分为不同的年龄组,但出现了 NA。在某些情况下,少数年龄组出现 1 或 2 例病例,这并不代表总病例数。
df_sa2 <- aggregate( cbind(cases=df_sa1$cases, agecat1=df_sa1$agecat1, agecat2=df_sa1$agecat2, agecat3=df_sa1$agecat3, agecat4=df_sa1$agecat4, agecat5=df_sa1$agecat5), by = list(Date=df_sa1$date, location=df_sa1$location), FUN = sum)
我检查了它们都是数字的数据类型。
请提出代码有什么问题。谢谢。
【问题讨论】:
-
如果您能提供reproducible example 会很有帮助,因为您很难准确理解您希望达到的目标。谢谢。
标签: r database aggregate grouping