【发布时间】:2014-05-03 19:33:25
【问题描述】:
我有一个大文件 (3.5G),我正在尝试使用 data.table::fread 导入。
它最初是从以文本形式打开并保存为 CSV 的 rpt 文件创建的。
这适用于较小的文件(具有相同类型的数据-相同的列和所有文件。这个只是用于更长的时间范围和更广泛的覆盖范围)。
当我尝试运行时
mydata <- fread("mycsv.csv")
我得到错误:
fread("mycsv.csv") 中的错误:在字符串中嵌入 nul:'y\0e\0a\0r\0'
这是什么意思?
【问题讨论】:
-
它看起来像 UTF-16(每个字符 2 个或更多字节,几乎总是 2 个字节)。对于 ASCII,您将看到 ASCII 值,然后是 0 字节。
-
我在加载从大型数据集生成的 RData 文件时遇到了同样的问题。我重新生成 RData,问题就消失了。似乎是我的 RAM 用尽时造成的。
-
当您尝试使用
fread不恰当地打开 RDS 文件时,也会出现此错误。不要问我怎么知道的。
标签: r data.table fread