【发布时间】:2013-06-30 05:17:49
【问题描述】:
有没有办法通过直接提供术语和术语频率而不是通过分析和/或 TokenStream 来将文档添加到索引中?我问是因为我想对一些我知道术语频率的数据进行建模,但没有要分析的基础文本文档。我可以通过多次重复相同的术语来创建一个(在这种情况下,我也不关心位置或突出显示,只是得分),但这似乎有点不合常理(并且可能比直接提供计数要慢)。
(也在邮件列表中询问)
【问题讨论】:
-
我正试图弄清楚如何使用 Solr (stackoverflow.com/questions/17996604/…) 做同样的事情。 femtoRgon 下面的答案是否对您来说是最佳解决方案?
-
我认为这将是最好的方式,但我还没有实现