【发布时间】:2012-03-26 01:59:58
【问题描述】:
我很难让 R 读取包含撇号的 .txt 或 .csv 文件。
我的一些专栏包含描述性文字,例如“关注客户需求”或“警长的副手”。我的文件在 Excel 中正确打开(即所有数据出现在正确的单元格中;有 3 列和大约 8000 行,并且没有丢失数据)。但是当我让 R 读取文件时,会发生这种情况:
data <-read.table("datafile.csv", sep=",", header=TRUE)
Error in scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings, :
line 520 did not have 3 elements
(第 520 行是包含撇号的第一行。)
如果我进入 .txt 或 .csv 文件并手动删除所有撇号,则 R 会正确读取文件。但是,如果可以的话,我宁愿保留撇号。
我是 R 新手,如果有任何帮助,我将不胜感激。
【问题讨论】:
-
我赞成,因为尽管我基本上知道这一点,但在读取数据采集机器中生成的 csv 文件时,我曾经得到“gotcha'd”。问题是,在一个相当大的标题块内,该文件有一些带有撇号的字段(意外发生)。有时您必须仔细查看源文件中的 crapola。
标签: r csv punctuation