【发布时间】:2011-04-26 11:13:10
【问题描述】:
我正在处理一些非常格式很差的日志文件,列分隔符是一个(经常)出现在字段中的项目,它不是逃脱了。例如:
sam,male,september,brown,blue,i like cats, and i like dogs
地点:
name,gender,month,hair,eyes,about
如您所见,about 包含列分隔符,这意味着分隔符的单个解析将不起作用,因为它会将 about me 分成两个单独的列。现在想象一下这个聊天系统......你可以想象我确定的问题。
那么,理论上解决这个问题的最佳方法是什么?我不是在寻找特定于语言的实现,而是更多指向正确方向的一般指针,或者关于其他人如何解决它的一些想法...... 没有手动进行。
编辑:
我应该澄清一下,我的 实际 日志处于更糟糕的状态。这些字段到处都是分隔符,我找不到任何模式。
【问题讨论】:
-
您能解释一下所选答案如何解决您的问题吗?我很想知道...