【发布时间】:2025-12-22 09:20:16
【问题描述】:
我是 R 编程语言的初学者,目前正在尝试从事一个项目。 有一个巨大的文档术语矩阵(DTM),我想将它转换成一个数据框。 但是由于功能的限制,我无法这样做。
我一直使用的方法是先转换成矩阵,再转换成数据框。
DF <- data.frame(as.matrix(DTM), stringsAsFactors=FALSE)
它与较小尺寸的 DTM 完美配合。但是,当 DTM 太大时,我无法将其转换为矩阵,从而产生如下所示的错误:
错误:无法分配大小为 2409.3 Gb 的向量
尝试在网上寻找几天,但我无法找到解决方案。 如果有人能够建议将 DTM 转换为 DF 的最佳方法(尤其是在处理大尺寸 DTM 时),将非常感激。
【问题讨论】:
-
可能不会,作者不一样,这里想要的内存分配很大。 DTM 往往是稀疏的,因此将它们天真地转换为(非稀疏)矩阵可能很危险。
标签: r