【发布时间】:2016-03-17 15:03:13
【问题描述】:
我正在使用 PrettyTime NLP 从列表中查找日期。
Example
ABC High School March 5, 2016
XYZ High School 08/20/2016 Gym
当我使用 PrettyTimeNLP 进行解析时,它会以这种格式给我一个日期列表。
Sat Aug 20 10:05:27 EDT 2016
我的问题是是否可以解析字符串,然后在日期之前或之后拆分它,以便我可以拥有
string1 = 'XYZ High School'
stirng2 = '08/20/2016'
string3 = 'Gym'
我知道我可以使用 RegEx 来完成这项工作,但这里的示例很简单。 我的文档将有 1-10 页长,并包含各种格式的日期。
任何有关如何操作 PrettyTime 的示例都将不胜感激。
【问题讨论】:
-
没有分隔符、固定宽度字段,或者使用正则表达式来处理所有预期的日期格式,您如何知道日期在字符串中的开始和结束位置?
-
@EmmanuelRosa,是的...我希望自从 PrettyTime NLP 已经识别自然语言日期以来,也许有办法获取该变量和其余部分。我试图破译密码,但我不是专家。昨天我正在努力解决这个想法,我想我将使用 PTNLP 来识别日期,然后使用 RegEx 来提取日期和行的其余部分。谢谢伊曼纽尔。
标签: java regex grails nlp prettytime