【发布时间】:2018-10-10 20:20:04
【问题描述】:
我有一个这样的数据框:
structure(list(mut = c("Q184H/CAA-CAT", "I219V/ATC-GTC", "A314T/GCG-ACG, P373Q/CCG-CAG, A653E/GCG-GAA","0")), row.names = c(NA, -4L), class = c("tbl_df", "tbl", "data.frame"))
我想要做的是在新列中获取“/”之后的所有内容,对于每行中的每个逗号分隔值,无论每行中有多少条目。
我想得到什么:
mut nt
1 Q184H CAA-CAT
2 I219V ATC-GTC
3 A314T, P373Q, A653E GCG-ACG, CCG-CAG, CGC-GAA
4 0 0
我已尝试为此使用正则表达式,但似乎无法匹配以逗号分隔的每个条目。
library(dplyr)
df %>%
mutate(nt = gsub(".+/(.*?)", "\\1", mut))
如何使每个条目都匹配?我必须将它们分开然后进行匹配吗?
【问题讨论】: