【发布时间】:2010-12-24 20:54:27
【问题描述】:
我正在尝试读取具有不同行长的文本文件:
1
1 2
1 2 3
1 2 3 4
1 2 3 4 5
1 2 3 4 5 6
1 2 3 4 5 6 7
1 2 3 4 5 6 7 8
为了克服这个问题,我在 read.table 中使用了参数 fill=TRUE,所以:
data<-read.table("test",sep="\t",fill=TRUE)
不幸的是,为了评估最大行长度,read.table 只读取文件的前 5 行,并生成一个如下所示的对象:
data
V1 V2 V3 V4 V5
1 1 NA NA NA NA
2 1 2 NA NA NA
3 1 2 3 NA NA
4 1 2 3 4 NA
5 1 2 3 4 5
6 1 2 3 4 5
7 6 NA NA NA NA
8 1 2 3 4 5
9 6 7 NA NA NA
10 1 2 3 4 5
11 6 7 8 NA NA
有没有办法强制 read.table 滚动整个文件以评估最大行长度? 我知道一个可能的解决方案是提供列号,例如:
data<-read.table("test",sep="\t",fill=TRUE,col.names=c(1:8))
但由于我有很多文件,我想在 R 中自动评估它。有什么建议吗? :-)
编辑:原始文件不包含渐进式数字,所以这不是解决方案:
data1<-read.table("test",sep="\t",fill=TRUE)
data2<-read.table("test",sep="\t",fill=TRUE,col.names=c(1:max(data1))
【问题讨论】:
-
你能在文件中放一个标题吗(即文件的格式是否一致)?
-
很遗憾,文件是在外部生成的,每一行都可以有随机数量的条目。