【问题标题】:PCA using prcomp for RNA seq in R在 R 中使用 prcomp 进行 RNA seq 的 PCA
【发布时间】:2017-05-04 00:57:02
【问题描述】:

我想知道是否需要转置数据以对 R 中的样本进行 PCA。我正在使用内置函数 prcomp()。我的数据集是 RNA seq 表达数据,列是样本,行是基因表达。似乎无论哪种方式都可以,但是对于行/列中应该包含的内容是否存在共识?谢谢!

【问题讨论】:

  • 从数学上讲,它确实会“以任何方式工作”。但是,对于大多数数据分析,列包含感兴趣的变量(您的案例中的基因),行包含这些变量的观察结果(您的案例中的样本)。
  • 谢谢@neilfws!澄清一下,我有兴趣查看样本之间的关系,使用基因作为载体。那么基因还应该在列中吗?

标签: r pca


【解决方案1】:

大多数生物统计学 R 软件包通过转置数据框来实现这一点。我给你一个证明:

RUV SVD 分解方法在 RNA-Seq 中很常见。看它的源代码:

https://github.com/drisso/RUVSeq/blob/master/R/RUVg-methods.R

if(isLog) {
    Y <- t(x)
} else {
    Y <- t(log(x+epsilon))
}

x 是基因矩阵表。你看到转置操作了吗?稍后在代码中,包将转置矩阵 (Y) 提供给 svd 函数。

svdWa <- svd(...)

为了让生活和其他人更轻松,您可能希望将基因放在列中,将样本放在行中。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2022-07-06
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多