【发布时间】:2019-08-29 17:27:47
【问题描述】:
我有一个数据框。 我想知道某个地区没有记录哪些疾病。 例如: A区没有腮腺炎
我想做的是,只要一个区域没有疾病,我想在n列中记录一个零。
我想可能是这样的
DATA$missing<-DATA%>% if (DISEASE %in% DISEASE){"no"}
但这不起作用,我真的没想到它会但确实希望它会......
这是我的数据,在此示例中,我通过过滤原始测试数据框从区域 A 中删除了腮腺炎。 我如何才能确定 Mumps 不在这个新数据集中的 A 区?以及可能缺少的疾病和区域的其他组合,然后在计数列中返回 n = 0 的值? 谢谢。
library (tidyverse)
library (epitools)
# here's my made up data
DISEASE = c("Marco Polio","Marco Polio","Marco Polio","Marco Polio","Marco Polio",
"Mumps","Mumps","Mumps","Mumps","Mumps",
"Chicky Pox","Chicky Pox","Chicky Pox","Chicky Pox","Chicky Pox")
YEAR = c(2011, 2012, 2013, 2014, 2015,
2011, 2012, 2013, 2014, 2015,
2011, 2012, 2013, 2014, 2015)
VALUE = c(82,89,79,51,51,
79,91,69,89,78,
71,69,95,61,87)
AREA =c("A", "B","C")
DATA = data.frame(DISEASE, YEAR, VALUE,AREA)
DATA<-DATA%>%filter(DISEASE !="Mumps" | AREA !="A")
编辑: 我的预期结果是这样的
new_row<-c("Mumps","2015",0,"A")
DATA<-rbind(DATA,new_row)
【问题讨论】:
-
那么您的预期结果是什么?
-
为清晰起见进行了编辑
-
为什么一定要在 2015 年之前推出新产品线?
-
绝对是复制品!感谢您找到这个。我将编辑我的问题。
标签: r dplyr data-munging