【问题标题】:Increasing relevancy of search results提高搜索结果的相关性
【发布时间】:2012-12-01 07:00:21
【问题描述】:

我无法让搜索输出对最终用户更实用。问题与算法和方法有关,然后与要使用的确切技术或框架有关。

目前我们有一个产品数据库,可以用以下模式描述:

从搜索的角度来看,我们已经完成了相当标准的工作,使用标记分析器进行 3 方文本搜索,处理错误类型和同义词(这不是完整列表,但正如我所说,它超出了范围)。但是我们仍然需要执行额外的工作以使搜索结果更接近现实生活中的用户需求,这可能有点类似于 Google 按相关性对索引页面进行排名的方式。我们已经认为可能适用于解决问题的想法:

  • 分析广泛搜索引擎中最流行的搜索请求(如何获取它们仍然是一个问题)并增加索引中与流行请求相对应(可以找到)的条目的排名;
  • 提高最新(热门)条目的排名;
  • 提高最大组条目的排名,这些条目对应于流行的请求并且有一些共同点(这就是为什么它是一个组);

感谢任何帮助或建议方向,在哪里挖掘。

【问题讨论】:

    标签: algorithm search full-text-search search-engine morphological-analysis


    【解决方案1】:

    你可以试试 pLSA;网上有很多参考资料,应该有库和源代码。

    编辑:

    好吧,我最近仔细研究了 Lucene,它似乎对实际提出的问题给出了更好的答案(它不使用 pLSA)。至于与 db 的集成,你可以使用 Hibernate Search(虽然它似乎没有直接使用 Lucene 强大)。

    【讨论】:

    • 谢谢,我们目前正在考虑应用它。
    猜你喜欢
    • 2014-02-18
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2016-01-05
    • 1970-01-01
    • 2013-12-17
    • 2015-09-20
    相关资源
    最近更新 更多