【问题标题】:Sunspot / Solr / Lucene : Find similar articleSunspot / Solr / Lucene : 查找类似文章
【发布时间】:2011-03-01 09:46:08
【问题描述】:

假设我们有一个由 sunspot/solr/lucene(或任何其他搜索引擎)索引的文章列表。

如何使用给定的文章找到相似的文章?

是否应该使用恢复工具来完成,例如: http://www.wordsfinder.com/api_Keyword_Extractor.php,或从 http://developer.yahoo.com/yql/consolehttp://www.alchemyapi.com/api/demo.html 提取的术语?

【问题讨论】:

  • 看到这个answer
  • 谢谢大家的好回答。

标签: solr lucene full-text-search morelikethis


【解决方案1】:

您似乎正在寻找MoreLikeThis 功能。

【讨论】:

    【解决方案2】:

    您尝试执行的操作与我在this answer 中概述的任务非常相似。

    简而言之,您需要为每个文档生成一个摘要,您可以将其用作查询以将其相互比较。文档摘要可以像该文档中的前 N ​​个术语一样简单(不包括停用词)。您可以很容易地从 Lucene 文档中生成前 N 个术语,而无需使用任何第三方工具,SOweb 上有很多示例可以做到这一点。

    【讨论】:

      猜你喜欢
      • 2013-07-31
      • 2012-12-17
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2011-09-28
      • 1970-01-01
      • 2019-05-23
      • 2011-04-12
      相关资源
      最近更新 更多