【问题标题】:issues with samR in RR中的samR问题
【发布时间】:2012-11-21 21:34:29
【问题描述】:

我在 Excel 中有以下 csv 格式的表格:

                    1       1       1       2     2         2
1415670_at  1   365.1   293.4   288.9   394.5   312     381.6
1415671_at  2   556.1   584.2   567.8   592.8   471.6   513.1
1415672_at  3   1048.3  763.1   1074.9  852.3   826.1   898.3
1415673_at  4   60.8    51.7    51.6    224     248.4   150.7
1415674_at  5   129.1   107.2   230.4   175.5   250.5   172.4

我一直在使用 SAM 来获取上调和下调基因的列表。为此,有一个 Excel 插件可以使用上述文件完成任务。 我遇到的问题是我需要使用 R 来分析这些数据,因为有一个名为 SAMR 的包。我想用第一列中的名称获取上调和下调基因的列表,但根本没有成功。 该手册可在此处获得:http://cran.r-project.org/web/packages/samr/samr.pdf 我做的小程序是:

filename<-"test.csv"
y<-c(1,1,1,2,2,2)           //I have to do this in this way, but I will extract the  
                            //first row from the csv file later
m<-read.csv(filename,sep=",",row.names=1)
t<-as.matrix(m)
samfit<-SAM(t,y,resp.type="Two class unpaired")

当我放

print(samfit)

我得到了以下数据:

Genes down
    Gene ID Gene Name Score(d) Numerator(r) Denominator(s+s0) Fold Change
[1,] g1753   1753      -2.025   -707.725     349.446           0.582      
[2,] g1375   1375      -1.038   -272.583     262.7             0.797      
[3,] g1302   1302      -0.955   -296.733     310.685           0.739      
[4,] g1598   1598      -0.923   -352.725     382.068           0.722      
[5,] g1500   1500      -0.913   -442.142     484.177           0.352

但我需要基因名称而不是基因列表中的基因 ID 和基因 有什么帮助吗? 谢谢

dput(m) 显示以下信息:

结构(列表(X.1 = 1:5, X1 = c(365.1, 556.1, 1048.3, 60.8, 129.1), X1.1 = c(293.4, 584.2, 763.1, 51.7, 107.2), X1.2 = c(288.9, 567.8, 1074.9, 51.6, 230.4), X2 = c(394.5, 592.8, 852.3, 224, 175.5), X2.1 = c(312, 471.6, 826.1, 248.4, 250.5), X2.2 = c(381.6, 513.1, 898.3, 150.7, 172.4)), .Names = c("X.1", "X1", "X1.1", “X1.2”,“X2”,“X2.1”,“X2.2”),class=“data.frame”,row.names = c(“1415670_at”, “1415671_at”、“1415672_at”、“1415673_at”、“1415674_a_at”))

【问题讨论】:

  • 请发布dput(m)的结果。
  • 我已将输出放入问题@Dwin
  • 不幸的是,您已对其进行了编辑,无法用于进行任何测试。
  • 原始文件很大,现在我只测试了这 5 个值并将原始 dput(m) 结果放入@DWin,感谢您的帮助

标签: r packages bioconductor


【解决方案1】:

'对于那个小数据集,'Genes down 矩阵为 NULL,但这显示了如何获取 'Genes Up' 矩阵的名称:

> rownames(m)[ as.numeric( samfit$siggenes.table$genes.up[ , "Gene Name"]) ]
[1] "1415674_a_at" "1415673_at"   "1415672_at"  

您需要使用数据框中的内容作为名称(一系列数字)来引用行名。为了您的完整模型拟合,您应该得到您想要的:

rownames(m)[ as.numeric( samfit$siggenes.table$genes.lo[ , "Gene Name"]) ]

对于未来的调查,可以通过首先查看“samfit”类,然后查看名为:print.SAMoutput 的函数并修改相关代码来发现这一点。无需使用 getAnywhere 或 :::,因为该函数没有隐藏。

【讨论】:

    猜你喜欢
    • 2017-10-28
    • 1970-01-01
    • 2017-05-08
    • 2015-01-06
    • 2015-07-08
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多