【发布时间】:2017-11-19 07:06:33
【问题描述】:
我有一个 Elasticsearch 索引,其中包含大约 25 亿个文档,在一个分析字段中包含大约 1800 万个不同的术语。是否可以在不搜索索引的情况下快速统计包含某个词的文档数量?
似乎 ES 会在分析字段时存储该信息,或者可能能够计算倒排索引的长度。如果有一种方法可以搜索多个术语并获取每个术语的文档频率,那就更好了。我想定期这样做数千次,但我不知道是否有有效的方法来做到这一点。
【问题讨论】:
标签: search elasticsearch lucene information-retrieval