【发布时间】:2019-03-13 18:50:47
【问题描述】:
我有一个包含以下列的数据框:
Col_A
tr_1 A1; gn_1 TG1;
tr_2 A2; gn_2 TG2;
tr_3 A3; gn_3 TG3;
tr_4 A4; gn_4 TG4;
tr_5 A5; gn_5 TG5;
我想使用 gsub 命令和正则表达式删除所有数据帧行中字符串“gn_1”开头到结尾的所有字符。或者用“”替换所有这些字符。
我想要的最后是这样的:
Col_A
TG1
TG2
TG3
TG4
TG5
你知道我如何在 r 中做到这一点。
【问题讨论】:
-
试试
sub("^.*gn_\\d+\\s([[:alnum:]]+).*$", "\\1", x)。