【问题标题】:TCGABiolinks: GDCprepare never terminates and crashesTCGABiolinks:GDCprepare 永远不会终止和崩溃
【发布时间】:2021-10-08 20:39:02
【问题描述】:

我最近开始使用 TCGAbiolinks 来处理 TCGA 数据库中的一些基因表达。我需要做的就是将数据下载到 R 文件中,网上有很多例子。但是,每次我尝试示例代码时,它都会使我的 R 工作区崩溃,有时甚至完全崩溃我的 PC。

这是我正在使用的代码:

library(TCGAbiolinks)

queryLUAD <- GDCquery(project = "TCGA-LUAD",
                      data.category = "Transcriptome Profiling",
                      data.type = "Gene Expression Quantification",
                      sample.type = "Primary Tumor",
                      legacy = FALSE,
                      workflow.type = "HTSeq - FPKM-UQ"
                      )

GGDCdownload(queryLUAD)

LUADRNAseq <- GDCprepare(queryLUAD,
                         save = TRUE,
                         save.filename = "LUAD.R")

如您所见,它非常简单并且(据我所知,完全相同)类似于 one 这样的示例。

当我运行此代码时,它会完全下载(我已经检查了包含文件的文件夹)。然后,我运行 GDCprepare。进度条开始并达到 100%。然后,该命令最终不会终止,无论是 RStudio 还是我的机器崩溃。

这是终端输出:

> GDCdownload(queryLUAD)
Downloading data for project TCGA-LUAD
Of the 533 files for download 533 already exist.
All samples have been already downloaded
> LUADRNAseq <- GDCprepare(queryLUAD,
+                          save = TRUE,
+                          save.filename = "LUAD.R")
|==============================================================================================|100%                      Completed after 13 s 

虽然它说已完成,但它从来没有。为了解决这个问题,我尝试重新安装 TCGAbiolinks,将 R 更新到最新版本,甚至在完全不同的机器上运行它(Mac 而不是 Windows)。我尝试了其他数据集(“LUSC”)并得到了完全相同的行为。什么都没有解决这个问题,我也没有在网上找到任何地方提到过这个问题。

我真诚地感谢任何关于为什么会发生这种情况以及如何解决它的建议。

【问题讨论】:

    标签: r crash bioconductor


    【解决方案1】:

    遇到完全相同的问题。尝试了各种方法,发现当数据集的样本少于 100 个或在数据集少于 300 个样本的情况下运行“summarizedExperiment = FALSE”时它不会崩溃。

    【讨论】:

    • 我的数据集每个都有 500 多个样本,因此这与您的发现一致。幸运的是,我找到了一个可以直接下载包含数据的 .csv 的站点,尽管它的效率不如 TCGABiolinks 方法
    【解决方案2】:

    我在这里面临同样的问题。看起来发生了某种内存泄漏,因为我的 RAM 使用率达到 100%。我设法“GDCprepare”了 500 个样本而不会因 ~64GB RAM 而崩溃,但即使在完成后,内存仍然被 R 会话占用,即使我尝试垃圾收集并删除环境中的所有内容。

    大约一年前,我对 TCGAbiolinks 没有这个问题...

    【讨论】:

    • 我无法 GDCPrepare 大约 500 个样本的数据集,但我的 RAM 只有 16 GB,这可以解释不同的行为。感谢您检查内存使用情况
    猜你喜欢
    • 2014-05-13
    • 2014-05-29
    • 1970-01-01
    • 1970-01-01
    • 2015-04-21
    • 1970-01-01
    • 2013-09-09
    • 2014-10-22
    • 2015-01-09
    相关资源
    最近更新 更多