【发布时间】:2015-01-30 23:57:26
【问题描述】:
我有一个 FSDirectory,我们称它为 NORMAL,它已经包含许多索引 Document 实例。现在,我想创建一个临时索引,即 RAMDirectory 和 IndexReader / IndexSearcher,其中包含以前索引的文档的子集(我们将此目录称为 TEMP)。
我想知道最好的方法是什么。在将数据索引到 NORMAL 时,我使用了一个对标记执行词干提取的分析器(EnglishAnalyzer);也并非所有字段都实际存储,即,其中一些仅被索引,但它们的值未存储在 Directory NORMAL 中。到目前为止很好。
- 但是,如果我现在获取此类文档的一个子集,我稍后会使用 IndexReader 阅读这些文档,并将它们读到 TEMP 目录中,例如是否也适合使用 EnglishAnalyzer 或者它是否会导致重新提取已经词根化了?
- 而且,如果一个字段根本没有存储,我想它不能用于将它添加到 TEMP 中,对吧?
【问题讨论】:
标签: apache lucene directory temporary