【问题标题】:R Save Files Into ArrayR 将文件保存到数组中
【发布时间】:2015-05-30 15:18:14
【问题描述】:

我有多个文件想要合并(.txt 和 .csv)。它们都是非常不同的表,所以我基本上希望拥有大约 30 张不同的表,然后能够保存该文件并稍后对其进行索引。

我在尝试找到最有效的方法时遇到了麻烦,因为我的大多数搜索最终都试图将文件合并()在一起,这是不可能的,因为这个数据文件集合是独一无二的。

最大的问题是每个数据框都不同,列名和行数各不相同,这与已提出的类似问题不同。

将我拥有的表组合成一个数组并保存它的最佳方法是什么?

编辑: 为了补充更多细节,我基本上拥有来自多个不同文件的三种不同类型的数据框:

.csv 文件,表头为“X”“gene”“baseMean”“log2FoldChange”“lfcSE”“stat”
“pvalue”“padj”“TuLob”“TuDu”

一种带有“hgnc_symbol”“ensembl_gene_id”“ensembl_transcript_id”“ensembl_peptide_id”标题的 .txt 文件
“带”“染色体名称”“开始位置”“结束位置”
“transcript_start” “transcript_end” “description” “go_id”
"name_1006" "transcript_source" "status"

还有第二种.txt文件,标题为“hgnc_symbol”“ensembl_gene_id”“ensembl_transcript_id”“ensembl_peptide_id”
“带”“染色体名称”“开始位置”“结束位置”
“transcript_start” “transcript_end” “description” “name_1006”
“transcript_source” “状态”

再一次,我不是要合并这些表,只是将它们保存在堆栈或三维数组中作为一个文件,以便稍后打开和索引

【问题讨论】:

标签: r


【解决方案1】:

我认为你想要做的是使用save 函数将数据保存为 R 的内部格式。

df1 <- data.frame(x=rnorm(100))
df2 <- data.frame(y=rnorm(10), z=rnorm(10))

为我们提供了两个具有不同列、行等的数据框。

save(df1, df2, file="agg.RData")

保存到agg.RData

你可以稍后做一个

load("agg.RData")
head(df1)
...

另请参阅attach,它执行 load 所做的工作,只是延迟执行,因此它只会在您尝试访问对象时加载它们。

最后,您可以通过为load 指定和环境来获得一些隔离措施:

agg <- new.env()
load("agg.RData", agg)
head(agg$df1)
...

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2015-08-23
    • 1970-01-01
    • 1970-01-01
    • 2015-12-11
    • 2012-07-28
    • 1970-01-01
    • 1970-01-01
    • 2021-05-25
    相关资源
    最近更新 更多