【发布时间】:2011-08-04 16:53:12
【问题描述】:
我有一个包含不同类型字符串行的巨大日志文件,我需要以“智能”方式从中提取数据。
示例 sn-p:
2011-03-05 node32_three INFO stack trace, at empty string asfa 11120023
--- - MON 23 02 2011 ERROR stack trace NONE
例如,从每一行中提取日期的最佳方法是什么,与日期格式无关?
【问题讨论】:
-
您的意思是“提取日期”吗?因为您的示例有两个日期。
-
我是否正确理解您的巨大日志文件包含不同类型的行,其中日期可能以不同的格式显示?如果是这种情况,那么正则表达式可能不是一个好的解决方案。
-
@heykalrm:我编辑了您的问题以在您的示例中显示单独的行,但我不确定我是否正确。请检查并确认分行位置正确。
-
@MarcoS 是的,日期可能以不同的格式显示。如果不是正则表达式,您的解决方案是什么?
-
我用另一种方法给出了答案:使用正则表达式来分隔日期字符串和 Joda 时间来解析它们。看我的回答。
标签: regex algorithm pattern-matching string-matching