【发布时间】:2014-01-05 21:22:48
【问题描述】:
我正在试验 Solr 的 MoreLikeThis 功能。
我的架构处理文章,我正在寻找三个领域内文章之间的相似之处: 文章标题、文章文本和主题。
以下查询运行良好:
q=id:(2e2ec74c-7c26-49c9-b359-31a11ea50453)
&rows=100000000&mlt=true
&mlt.fl=articletext,articletitle,topic&mlt.boost=true&mlt.mindf=1&mlt.mintf=1
但我想尝试提升不同的查询字段 - 例如,更加重视文章标题中的相似性。
文档 (http://wiki.apache.org/solr/MoreLikeThis) 建议这可以通过包含 mlt.qf 属性和一些提升来实现。
我对此类查询的尝试如下:
q=id:(2e2ec74c-7c26-49c9-b359-31a11ea50453)&rows=100000000&mlt=true
&mlt.fl=articletext,articletitle,topic&mlt.boost=true
&mlt.mindf=1&mlt.mintf=1
&mlt.qf=articletext^0.1 articletitle^100 topic^0.1
但是,提升似乎没有任何影响 - 无论我提供什么提升,建议都保持不变(除了上述查询,我会大力支持标题中的相似性,但这似乎并没有发生)
我在文档中找不到任何以这种方式使用 MoreLikeThis 的示例,这让我相信我有问题。
有没有人设法实现这样的目标?
【问题讨论】:
-
我也刚开始遇到这个问题。您也可以将 mlt.interestingTerms=details 参数放在那里,以查看它根据原始文档选择的术语,并且无论我在 mlt.fl 参数中输入什么(或我输入什么字段),它们似乎都没有改变省略)。
标签: solr lucene solrnet recommendation-engine morelikethis