【发布时间】:2012-03-25 23:56:59
【问题描述】:
我目前在 lucene 4.0 上使用快照版本(因为 bm25),我想知道是否有可能获得给定术语的分数。 例如,在索引上,我为每个文档存储两个字段,即内容字段中的文档内容和作者字段中的作者。 现在,当我检索文档时,我也会获取作者,但是当我获取作者时,我会活着得到每个作者的分数(收藏范围的分数),这样我就可以对作者进行排序。
即,是否有可能在获取作者后,为每个作者查询 lucene 并以这种方式找到其各自的分数(我依赖于 BM25 评分模型)?是的,这是最好的方法吗?
非常感谢
【问题讨论】:
-
:),我不知道我必须这样做,现在我确实做到了。好吧,我无法从您发送的链接中获得太多帮助,但在发布之前我确实已经看过它
-
@Nik:你的意思是你想要一个词在语料库中出现的次数?我不确定作者有分数意味着什么——通常是有分数的文档。
标签: lucene