【发布时间】:2012-11-15 08:05:28
【问题描述】:
我对 Lucene 很陌生。我有一个 Lucene 4.0 索引,我想计算第 n 个最常用的词来创建一个停用词列表。我在先前版本的 Lucene 中发现了处理这个问题的帖子,例如 Get highest frequency terms from Lucene index 但似乎 reader.terms() 在 4.0 中已被弃用。
如何使用 Lucene 4.0 实现这一点?
谢谢!
【问题讨论】:
-
实际上 Luke 4.0 确实符合我的目的。无论如何,编程方法会更好:)
标签: lucene