【发布时间】:2013-09-26 04:18:42
【问题描述】:
我有一个稀疏数据集,它的列数长度各不相同,采用 csv 格式。这是文件文本的示例。
12223, University
12227, bridge, Sky
12828, Sunset
13801, Ground
14853, Tranceamerica
14854, San Francisco
15595, shibuya, Shrine
16126, fog, San Francisco
16520, California, ocean, summer, golden gate, beach, San Francisco
当我使用时
read.csv("data.txt", header = F)
R 会将数据集解释为具有 3 列,因为大小是根据前 5 行确定的。无论如何强制 r 将数据放在更多列中?
【问题讨论】:
-
你知道你的数据集中的最大列数吗?
-
是的,最大列数已知
-
我的直觉是在
read.table中指定colClasses参数(具有最大列数)并结合fill = TRUE应该读入文件。 -
@BlueMagister 我也是这么想的,但是没用。
-
你能不能用 2 行和正确的列数创建一个虚拟的
data.frame,然后将rbind文本文件添加到它?
标签: r csv import read.table sparse-columns