【发布时间】:2018-11-06 18:27:25
【问题描述】:
我有一个字符 id 向量,作为 R 中数据框的行名。行名具有以下模式:
head(foo)
[1] "ENSG00000197372 (ZNF675)" "ENSG00000112624 (GLTSCR1L)"
[3] "ENSG00000151320 (AKAP6)" "ENSG00000139910 (NOVA1)"
[5] "ENSG00000137449 (CPEB2)" "ENSG00000004779 (NDUFAB1)"
我想以某种方式对上述行名(约 700 个条目)进行子集化,以便仅保留括号部分中的基因符号 - 即ZNF675-并删除其余部分:这可以通过 gsub 之类的功能实现吗?
【问题讨论】:
-
一旦去除了 ensembl-ID,基因符号是否是唯一的?
-
亲爱的 Russ Hyde,是的,没有返回重复值
标签: r subset data-manipulation