【问题标题】:how to get a list of all tokens from Solr/Lucene index?如何从 Solr/Lucene 索引中获取所有令牌的列表?
【发布时间】:2010-12-04 21:53:46
【问题描述】:

我想知道有没有办法从 Lucene/Solr 索引中的特定记录中获取所有令牌?

谢谢。

【问题讨论】:

  • 这与 Lucene 的工作方式完全相反。你确定要这个吗?
  • 是的,我确定。我想从文本中收集所有标记,我知道 Lucene/Solr 最适合这项任务。

标签: solr lucene


【解决方案1】:

您可以使用IndexReader.terms() 获取倒排索引中出现的所有术语的枚举。这个方法返回一个TermEnum.

【讨论】:

  • 谢谢 Athena,我找到了另一个解决方案。我直接使用solr的过滤器来获取token...
  • @cherven 你能分享任何你找到解决方案的链接吗?
  • @Cherven 是的,请分享您的解决方案。我也不知道从 SOLR 获取令牌的简单方法。 (哇,7年过去了)
猜你喜欢
  • 1970-01-01
  • 2014-08-27
  • 2021-05-30
  • 2017-04-24
  • 2011-02-22
  • 2011-11-04
  • 1970-01-01
  • 2011-10-26
  • 1970-01-01
相关资源
最近更新 更多