【发布时间】:2012-10-04 23:21:28
【问题描述】:
我看到有几个类似的问题,但我没有找到任何令人满意的答案。我有一个逗号分隔的文件,其中每一行看起来像这样:
4477,52544,,,P,S, ,,SUSAN JONES,9534 Black Bear Dr,,"CITY, NV 89506",9534 BLACK BEAR DR,,CITY,NV,89506,2008,,,, , , , ,,1
出现的问题是,当一个标记用引号“CITY, NV 89506”转义逗号时
我需要一个结果,其中处理转义的令牌并包含每个令牌,甚至是空的。
【问题讨论】:
-
我很想自己进行解析。好像不太难。
-
拆分这个正则表达式,我在另一个问题上找到,让我非常接近 regex = ",(?=([^"]*"[^"]*")*[^"] *$)"。问题是我在结果中有引号。我不知道如何删除引号。
-
这个问题其实已经被问过很多次了。关键字是相当多变的。例如,请参阅 stackoverflow.com/questions/6432408/… 和 stackoverflow.com/questions/6428053/…。
-
您想如何处理分隔符逗号旁边的空格?例如,您的示例中的第七个值是空字符串还是 4 个空格的字符串?
-
Ted- 空格或空字符串仍应显示为值。这是挑战的一部分。