【发布时间】:2013-12-16 19:36:56
【问题描述】:
我已经阅读了 lucene 4.0 的文档,现在这个库存储了一些统计数据,以便计算不同的评分模型,其中之一是 bm25。除了获取文档之外,还有其他方法可以获取它的长度吗?
【问题讨论】:
-
文档的长度是多少?字节/代码点/字段的数量?
-
它是多个术语,与用于计算 BM25 的长度相同,我知道这个统计数据存在于 Lucene 4 中,否则无法计算 bm25,但我不知道如何去拿它?
标签: lucene