【发布时间】:2018-10-29 03:47:51
【问题描述】:
我有一个包含两列的数据框:一列名为“path_name”,包含 74 条路径,另一列名为“genes”,包含每个路径的基因列表。此外,我有一个包含 28 个突变基因的载体。我需要知道我可以在哪个途径中找到每个突变基因。例如:
mutated_genes=("MAP4K4" "TRAF2" "CACNG3" ...)
hsa04010__117 MAP4K4,DUSP10*,DUSP10*,DUSP10*,DUSP10*,DUSP10*,DUSP10*, DUSP10*,DUSP10*,DUSP10*,DUSP10*,DUSP3*,DUSP3*,DUSP3*,DUSP3*,PPM1A,AKT3,AKT3,AKT3,ZAK,MAP3K12,MAP3K13,TRAF2,CASP3,IL1R1,IL1R1,TNFRSF1A,IL1A,IL1A,TNF,RAC1,RAC1,RAC1,RAC1,MAP2K7,MAPK8,MAPK8,MAPK8,MECOM,HSPA1A,HSPA1A,HSPA1A,HSPA1A,HSPA1A,HSPA1A,MAP4K3,MAPK8IP2 MAP4K1....
hsa04014__118 MAP4K4,DUSP10*,DUSP10*,DUSP10*,DUSP10*,DUSP10* ...
我需要这样的东西:
hsa04010= MAP4K4 TRAF2
hsa01014= CACNG3
....
我不知道如何使用 R 过滤数据框中包含的列表。我尝试使用子集函数来过滤,但它不正确。有谁能帮助我吗?提前致谢。
【问题讨论】:
-
你能告诉我你的数据框的确切结构 - str(my_df)