【发布时间】:2021-04-17 10:24:27
【问题描述】:
我有以下数据框:
data <- data.frame(id = c(1,2,3,4,5,6),
exposure = c("BMI", "BMI etc.", "BMI neuronal", "WHRadjBMI", "WHR", "BF"))
id exposure
1 1 BMI
2 2 BMI etc.
3 3 BMI neuronal
4 4 WHRadjBMI
5 5 WHR
6 6 BF
我想从该数据框中删除 exposure 列中包含“BMI”但不包含“adj”的所有行,以便我可以将所有与 BMI 相关的行分组到一个称为“BMI”的单一因子级别。实际数据框约为 2500 行 x 50 列。
因此,子集将导致以下数据框,此处第 1、2 和 3 行已被删除,因为它们包含“BMI”但不包含“adj”:
id exposure
4 4 WHRadjBMI
5 5 WHR
6 6 BF
然后我可以将包含行的“BMI”但不包含“adj”的行组合成单个因子水平,这样第 1、2 和 3 行将变为:
id exposure
1 1 BMI
2 2 BMI
3 3 BMI
我可以按如下方式完成最后一部分:
data$exposure <- "BMI"
【问题讨论】: