【发布时间】:2014-03-19 23:40:10
【问题描述】:
我应该阅读一个大的 CSV 文件(超过 30000 行和 10000 列)。不知何故,我应该逐列读取数据。这是我的代码:
con<-file("D:\\Data.csv","r")
datalist<-list()
for(spalte in 5:5)
{
for(i in 1:20000)
{
line<-readLines(con,n=1,warn=FALSE)
m<-list(as.integer(unlist(strsplit(line,split=","))))
datalist<-c(datalist,sapply(m,"[[",spalte))
}
}
但是这段代码需要 4 分钟才能读取一列(在本例中为第 5 列)。我应该怎样做才能更快地完成这项工作?
【问题讨论】:
-
是否绝对需要逐行读取数据?为什么?
-
如果我使用
read.csv方法,我会收到有关文件大小的错误