【发布时间】:2020-12-05 17:46:43
【问题描述】:
我正在读取一个包含 2000 行和 3000 列的大型数据文件。据我所知,该文件仅包含整数。但是,当我在 R 中使用 fread 时,我会跨列获得以下唯一类:
“逻辑”“整数”“整数64”“数字”
我预计会有“逻辑”,因为有时数据包含 NA。但是为什么单个文件跨列包含多个不同的类?有些列是整数,有些是整数64,有些是数字,这是否正常?
【问题讨论】:
-
它会根据列值自动选择类型。
logical可能是因为如果只有 NA 并且默认情况下它是 NA_logical_。另外,检查.Machine$integer.max是否高于它可以被不同地解析 -
@akrun 好吧,这是有道理的。所以我认为这种混合不是问题。
-
与
fread一起,也加载了int64。所以这可能是一些具有大值的列被转换为 integer64 的原因。但是,您始终可以在指定所需类型的地方使用colClasses参数覆盖
标签: r