【发布时间】:2018-03-02 14:04:13
【问题描述】:
我即将从社交媒体、新闻网站、博客中发布的与政治、战争、药物等特定领域相关的 RAW 测试中提取一些信息。所以我已经开始使用一些开源库例如 stanford-nlp、apache OpenNLP 以及名为 lexalytics 的商业许可工具。
根据我的项目,我们正在分析公开发布的文本并生成一些结果并根据一些参数进行挖掘以识别这些帖子与什么类别相关。
但我需要使用 stanford-nlp 库从给定文本中提取主题。主题是指与教育、政治等相关的文本或句子。我已经能够以这样的方式提取包含 LOCATION、DATE、PERSON、MONEY 的文本/句子等实体。
lexalytics 也提供相同的主题提取功能,它是许可工具。
感谢您的帮助。
谢谢。
【问题讨论】:
-
如果可以显示文本/段落的摘要并且还可以提取主题,那就更好了。
-
你能给个样本文件吗?
-
或一对....
-
@Daniel 您可以从新闻网站或社交媒体获取任何原始文本。我有示例输入,但无法附加到此处。由于无法附加附件。
-
您可以将其包含在您的消息中。
标签: java nlp stanford-nlp opennlp