【发布时间】:2011-01-10 07:38:52
【问题描述】:
可能重复:
Java : Is there a good natural language processing library
我需要一个用 java 编写的简单自然语言处理库,可用于处理搜索查询/问题。我实际上想要的是分离查询中正在搜索的主要主题。例如,考虑像“什么是苹果?”这样的查询,如果可以提取主要搜索词苹果,那就完美了。这是出于语义搜索引擎开发目的。
谁能为此推荐一个合适的 nlp 库?
谢谢!!
【问题讨论】:
可能重复:
Java : Is there a good natural language processing library
我需要一个用 java 编写的简单自然语言处理库,可用于处理搜索查询/问题。我实际上想要的是分离查询中正在搜索的主要主题。例如,考虑像“什么是苹果?”这样的查询,如果可以提取主要搜索词苹果,那就完美了。这是出于语义搜索引擎开发目的。
谁能为此推荐一个合适的 nlp 库?
谢谢!!
【问题讨论】:
我看到的最简单的方法是使用AlchemyAPI 的概念标记。您还可以使用一些来自问题的库插件,在 cmets 中指出,特别注意 OpenNLP 和 GATE。如果您要构建基于本体的搜索引擎,我建议您阅读this 关于基于本体的关键字解释的论文,该论文显示了用户习惯的一些趋势(video version)。否则,您最好使用一些统计技术,例如LSA。
【讨论】:
Jakarta Lucene/Solr? http://lucene.apache.org/java/docs/index.html
【讨论】: