【问题标题】:Get list of terms that were highlighted by Solr获取 Solr 突出显示的术语列表
【发布时间】:2012-03-11 02:05:54
【问题描述】:

当我搜索单词“fish”时,我会返回包含该单词和该单词变体的文档列表。如果我打开突出显示,我可能会看到一个如下所示的 sn-p: 法律要求任何人<em>fishing</em> 在公共湖泊...

我想向用户展示上面的 sn-p,顺便说一下,它工作得很好,但我也想向用户展示一个完整的单词列表,如果我显示所有 sn- ps.

例如,我希望能够向用户显示以下内容:

第 18.32A 节 - 狩猎和捕鱼 ...法律要求任何人<em>钓鱼</em>在公共湖泊... 文档还包含:鱼、钓鱼、渔夫

除了让 solr 突出显示整个文档然后我解析文档以查找 em 标签并构建突出显示的单词列表之外,你还有其他方法来获取单词列表吗?

【问题讨论】:

  • 我猜你将不得不从文档中获取 all sn-ps,以便它采用易于提取的形式。您将不得不使用the highlighting options 来获取大量的sn-ps,每个sn-ps 都是通过“深入”文档来获取的。您可能需要在两个字段中复制数据(是的,它很难看),一个字段显示可读的 sn-ps,另一个字段获取相同词干的单词(请参阅词干)。

标签: solr highlighting term


【解决方案1】:

我会调查片段大小 (hl.fragsize)、同义词 (synonym.txt) 或词干(可以帮助处理单词的变体)以找到解决方案。您可以将fish、fishing、fished 设置为同义词中的所有含义。确保您了解全部展开的工作原理以及您是否希望搜索相互替换。还要确保您知道是索引同义词文件还是使用它进行查询。不要在索引时和查询时都使用同义词。还有一个开关可以在突出显示中启用多个匹配项。

【讨论】:

    猜你喜欢
    • 2011-04-30
    • 2018-08-22
    • 2011-09-22
    • 2013-12-21
    • 2019-03-30
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多