【发布时间】:2017-06-02 12:53:03
【问题描述】:
过去两天我一直在尝试使用 RxImport 函数将大型 CSV(9 gigs)转换为 XDF 格式,但没有成功。
R 服务器开始读取数据块的过程似乎很好,但几分钟后它会慢下来,然后在大约 6 小时后完全失败,Windows 停止服务器说它的 RAM 用完了。
我使用的代码如下:
pd_in_file <- RxTextData("cca_pd_entity.csv", delimiter = ",") #file to import
pd_out_file <- file.path("cca_pd_entity.xdf") #desired output file
pd_data <- rxImport(inData = pd_in_file, outFile = pd_out_file,
stringsAsFactors = TRUE, overwrite = TRUE)
我正在运行 Microsoft R Server,版本 9.0.1。在具有 16gig RAM 的 Windows 7 机器上。
谢谢
【问题讨论】:
-
看看设置
colInfo参数是否有帮助 -
感谢您的建议,我会尝试一下。我有近 300 列数据,因此假设我可以导入数据的子集并使用 rxGetVarInfo 命令提取列信息并将其传递给 rxImport 命令而不是手动指定每个列是正确的吗?
-
成功了!!! Arg 这太棒了:D 谢谢谢谢谢谢
标签: r microsoft-r