【发布时间】:2011-01-21 18:56:39
【问题描述】:
我要读取的数据集包含带有和不带有逗号作为千位分隔符的数字:
"Sudan", "15,276,000", "14,098,000", "13,509,000"
"Chad", 209000, 196000, 190000
我正在寻找一种方法来读取这些数据。
感谢任何提示!
【问题讨论】:
我要读取的数据集包含带有和不带有逗号作为千位分隔符的数字:
"Sudan", "15,276,000", "14,098,000", "13,509,000"
"Chad", 209000, 196000, 190000
我正在寻找一种方法来读取这些数据。
感谢任何提示!
【问题讨论】:
由于问题下方有一个“r”标签,我认为这是一个 R 问题。 在 R 中,您不需要做任何事情来处理带引号的逗号:
> read.csv('t.csv', header=F)
V1 V2 V3 V4
1 Sudan 15,276,000 14,098,000 13,509,000
2 Chad 209000 196000 190000
# if you want to convert them to numbers:
> df <- read.csv('t.csv', header=F, stringsAsFactor=F)
> df$V2 <- as.numeric(gsub(',', '', df$V2))
【讨论】:
您可以使用以下正则表达式删除逗号和任何周围的引号以保留纯 csv 内容
,(?=[0-9])|"
然后正常处理
【讨论】:
如何将其作为一个两步过程来完成。 1.用TAB字符替换“,” 2. 按标签拆分。
我假设这里是 .NET,但示例原则适用于任何语言
【讨论】:
查看那组数据,您可以使用“,”(注意多余的空格)作为“,”的分隔符来解析它
【讨论】: