【发布时间】:2018-12-08 03:53:07
【问题描述】:
我正在从事一个涉及使用 Apache Lucene 索引文件的项目。虽然我能够成功地使用 Lucene 对文件进行索引,但是当我看到结果时,我得到了很多突然的词,可能是因为我在索引时没有删除停用词。
我在网上看到 Lucene 提供了一种在索引文件时删除停用词的方法。我该怎么做?
【问题讨论】:
-
我的回答描述了停用词的工作原理,希望对您有所帮助,但根据您对问题的描述,我并不完全相信停用词是您的问题。我不知道你说“看到结果”指的是什么结果,我也不知道什么是“突兀的话”。如果停用词不是问题,对您看到的问题进行更详细的描述(最好是示例)可能有助于解决问题。
标签: java lucene information-retrieval