【发布时间】:2017-12-04 17:22:44
【问题描述】:
我正在处理其他人的数据,其列的可能值为“短”和“长”。不幸的是,数据创建者还在这些词之后添加了字母和问号来注释某些东西,我想将它们分成单独的列。以下是一些可以使用的假数据:
vars <- c('long','short','longG','short?','short?F','long?G')
species <- c('sp1','sp2','sp3','sp4','sp5','sp6')
testdf <- cbind(vars, species)
我想将vars 列拆分为实际值long 或short,以及一个仅包含注释字符的新列。我可以通过以下方式到达一半,它正确地生成了一个只有注释字符的新列:
testdf %>% mutate(notes = gsub('long|short',"",vars)
但我不知道如何拆分或子集var,以便我得到一个只显示short 或long 的列。
提前感谢 SO 社区的帮助! ^_^
【问题讨论】:
-
预期输出是什么?