【发布时间】:2017-08-31 01:55:17
【问题描述】:
我是 NLP 新手,我正在寻找一些教程、文档或示例代码方面的起点。 我被告知要研究处理自然文本以从中提取一些结构化数据的可能性。 例如,我想从以下语句中提取(注释)身高和体重。 “他身高 6 英尺,体重 200 磅”或 “他的身高是 6 英尺,体重是 200”等。 我研究过 UIMA,但它似乎是一个没有培训能力的自创 REGEX 字典。 所以简而言之,我可以使用什么 Java 框架来创建一个也可以训练的注释引擎! 对此的任何帮助(指针)将不胜感激。 谢谢
【问题讨论】:
-
顺便说一句。要了解信息提取技术的艺术开端,我建议阅读 Sunita Sarawagi 最近的一项调查 - osm.cs.byu.edu/CS652s09/papers/Sarawagi.ieSurvey.pdf
标签: java annotations nlp