【问题标题】:How to optimize ElasticSearch multiple queries如何优化 ElasticSearch 多个查询
【发布时间】:2016-03-25 02:50:23
【问题描述】:

我有一个名为 user_info 的索引,在索引下有两种类型,称为用户和事件。现在我需要查询 200 个用户,每个用户有 10 个事件。 所以我做了如下查询(sodu脚本): 搜索用户:

{size:200,"match:{"user_address":"CA Sf"}}

然后我向事件类型发出了 200 个查询: 搜索事件:

{size:10,"term":{"userid":"id1"}}
{size:10,"term":{"userid":"id2"}}
....
{size:10,"term":{"userid":"id200"}}

任何想法请优化上述查询,谢谢!

【问题讨论】:

    标签: elasticsearch


    【解决方案1】:

    您可以使用以下查询:

    {
    "query": {
      "terms": {
         "userid": [
            // list of userId
         ]
      }
    },
    "aggs": {
      "group By user": {
         "terms": {
            "field": "userId"
         },
         "aggs": {
            "Group By event": {
               "terms": {
                  "field": "event_type"
               },
               "aggs": {
                  "top10": {
                     "top_hits": {
                        "size": 10
                     }
                  }
               }
            }
          }
        }
      }
    } 
    

    如果您对所有 200 个用户 ID 运行此查询,该查询会很慢。您最好将 userId 列表分成块,然后运行上述查询。

    【讨论】:

    • 很好的答案,请回答以下问题,实际上我有三种事件类型:talk_event、action_event、history_event。每个事件应该根据每个 userId 返回 10 条记录,我应该使用多个搜索 API 来组合这些类型的查询。
    • 对不起,我可能把你弄糊涂了,我的意思是有三种Index_type,例如:user_info/talk_event、user_info/action_event、user_info/history_event。索引名称是 user_info。
    【解决方案2】:

    查看terms 查询

    类似的东西

    {size:200, "terms" : { "userid" : ["id1", "id2", ... ,"id200"]}}
    

    【讨论】:

    • 根据问题,每个 userId 必须有 10 个事件对应。提供大小 200 并不能保证每个 userId 将有 10 条记录。如果我错了,请纠正我。
    • 同意,如果这确实是操作人员想要的,那么您的解决方案就是要走的路
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2016-10-04
    • 1970-01-01
    • 1970-01-01
    • 2011-06-12
    • 2022-01-23
    • 1970-01-01
    相关资源
    最近更新 更多