【发布时间】:2019-05-10 17:41:41
【问题描述】:
当我将此文件 Chicago_Crimes_2005_to_2007.csv(链接 https://www.kaggle.com/currie32/crimes-in-chicago)加载到 RStudio 中时,我总是收到错误消息(Warnmeldung: 在 scan(file = file, what = what, sep = sep, quote = quote, dec = dec,: EOF in Zeichenkette / English: EOF within quoted string) 中,并非所有观察都包括在内。你知道如何解决问题吗?对于其他 3 个文件,我没有问题。我正在使用此代码:
c2 = read.csv("Chicago_Crimes_2005_to_2007.csv", header = TRUE)
我试图用这段代码修复它:
c2 = read.csv("Chicago_Crimes_2005_to_2007.csv", header = TRUE, quote = "", row.names = NULL, stringsAsFactors = FALSE).
没有解决。我在stackoverflow中尝试了所有答案,但出现了同样的错误。没有任何帮助。自 1 周以来没有成功。希望有人能帮助我。在 RStudio 中使用 R。
【问题讨论】:
-
尝试使用
data.table::fread()读取文件...我的经验是它有时会自动“修复”源文件中的奇怪错误 -
@Wimpel 感谢您的帮助。试过但得到这个错误:
In data.table::fread("Chicago_Crimes_2005_to_2007.csv", header = TRUE) : Stopped early on line 533719. Expected 23 fields but found 46. Consider fill=TRUE and comment.char=. First discarded non-empty line: -
<<537288,5601758,HN409865,06/16/2007 08:15:00 PM,020XX E 94TH ST,1330,CRIMINAL TRESPASS,TO LAND,OTHER RAILROAD PROP / TRAIN DEPOT,False,False,413,4.0,8.0,48.0,26,1191237.0,1843038.0,2007,04/15/2016 08:55:02 AM,41.724300463,-87.575094193,"(41.724300463, -87.5,ID,Case Number,Date,Block,IUCR,Primary Type,Description,Location Description,Arrest,Domestic,Beat,District,Ward,Community Area,FBI Code,X Coordinate,Y Coordinate,Year,Updated On,Latitude,Longitude,Location>> -
请edit您的问题,而不是添加 cmets。另请注意,“Zeichenkette”只是字符串,而不是带引号的字符串。澄清错误描述——“不起作用”没有用。