【发布时间】:2017-03-20 04:19:27
【问题描述】:
我需要将包含基因名称的列添加到数据框中,其中包含有关异构体丰度的信息。我有两张桌子。
DF 1(包含整体基因 ID #s 作为行名和大约 15 个附加列中的各种异构体丰度值)
event_name sample1_posterior_mean
gene:ENSMUSG00000079523 0.93,0.02,0.00,0.06 0.90,0.01,0.00,0.04
gene:ENSMUSG00000078572 0.78 0.67
gene:ENSMUSG00000022548 0.63 0.25
DF 2(包含 3 列集合基因 ID #s 和基因名称)
Ensemble_Transcript_ID Ensemble_Gene_ID External_Gene_ID
2335 ENSMUST00000101973 ENSMUSG00000096659 Gm25679
2336 ENSMUST00000179019 ENSMUSG00000095915 n-R5s115
2337 ENSMUST00000183908 ENSMUSG00000099299 Gm27722
2338 ENSMUST00000044752 ENSMUSG00000039481 Nrtn
2339 ENSMUST00000179157 ENSMUSG00000095476 Gm25077
我想将 DF 2 中的 External_Gene_ID 列添加到 DF 1 中适当的 Ensemble_Gene_ID 列。我知道有一种方法可以根据感兴趣的列将这两个数据框合并在一起
我希望我已经足够详细地解释了这一点。感谢您的帮助!
【问题讨论】:
-
“我知道有一种方法可以根据感兴趣的列将这两个数据框合并在一起”——这引出了一个问题——那你为什么不尝试呢?
-
试试这个例子,我们也可以按行名合并。
df1 <- mtcars[, 1:2]; df2 <- mtcars[, 3:4]; df2$myCol <- rownames(mtcars); merge(df1, df2, by.x = "row.names", by.y = "myCol"),更多信息请参见here。
标签: r bioinformatics genetics