【发布时间】:2016-01-15 05:07:43
【问题描述】:
我是 Elastic Search 的新手,并且有一个包含大量文章的索引。我使用了 3 个主要领域;标题、sn-p 和日期。我想在标题字段中找到特定日期的最常见或最热门的关键短语或关键字。我希望有人可以提供有关如何执行此操作的示例,或者至少为我指明正确的方向。
非常感谢!
【问题讨论】:
标签: elasticsearch
我是 Elastic Search 的新手,并且有一个包含大量文章的索引。我使用了 3 个主要领域;标题、sn-p 和日期。我想在标题字段中找到特定日期的最常见或最热门的关键短语或关键字。我希望有人可以提供有关如何执行此操作的示例,或者至少为我指明正确的方向。
非常感谢!
【问题讨论】:
标签: elasticsearch
我认为您正在寻找terms aggregation。试试这样的
{
"query": {
"match": {
"date": {
"query": "your_date"
}
}
},
"size": 0,
"aggs": {
"common_words": {
"terms": {
"field": "title",
"size": 10
}
}
}
}
您会在顶部找到常用词,因为它们是按计数排序的。
如果您正在寻找phrases,您可能需要相应地analyze 您的标题字段。您可以使用multiple analyzer 映射标题。例如,standard analyzer 用于常用词,shingle analyzer 用于常用短语。
如果您想发现一些不寻常的东西,您可能还想查看significant terms aggregation。