【发布时间】:2015-08-19 19:04:50
【问题描述】:
假设我有一个如下所示的 csv 文件:
Type,ID,NAME,CONTENT,RESPONSE,GRADE,SOURCE
A,3,"","I have comma, ha!",I have open double quotes",A,""
期望的输出应该是:
df <- data.frame(Type='A',ID=3, NAME=NA, CONTENT='I have comma, ha!',
RESPONSE='I have open double quotes\"', GRADE=A, SOURCE=NA)
df
Type ID NAME CONTENT RESPONSE GRADE SOURCE
1 A 3 NA I have comma, ha! I have open double quotes" A NA
我尝试使用read.csv,因为数据提供者使用引号来转义字符串中的逗号,但是他们忘记了在没有逗号的情况下转义字符串中的双引号,所以无论我是否禁用read.csv中的引号我都赢了'没有得到想要的输出。
如何在 R 中做到这一点?也欢迎其他软件包解决方案。
【问题讨论】:
-
read.csv("data.csv", quote='', sep=',')不起作用,因为content列将是错误的。read.csv("data.csv", quote='')不起作用,因为列没有正确分离