【问题标题】:does azure search replica/Partitions impact index update speed?天蓝色搜索副本/分区会影响索引更新速度吗?
【发布时间】:2020-01-09 10:08:27
【问题描述】:

我们有一个 2016 年创建的 azure search instance(s1, 2 replica, 2 Partitions),当我尝试向该实例上传 5000 万行时,我们发现旧实例仍有 3000 万条记录的限制。

没问题,我新建了一个azure search instance(s1,1个replica,1个Partition),开始上传同样的数据了。令我惊讶的是,与旧实例相比,新实例的上传速度要快得多(几乎是更新速度的两倍)。

我想知道可能是什么原因?我上传的索引是一个新索引,所以没有人会查询它。这些是我可以看到的新旧搜索索引之间的差异:

  1. 新搜索实例、旧搜索实例中没有查询流量 确实从生产环境中获得流量。但它在其他搜索索引上。
  2. 新的搜索实例有 1 个副本,1 个分区,旧的有 2 个副本,2 个分区。

只是很好奇为什么我会看到这样的速度差异。实际上,如果我运行搜索查询,新旧之间的性能将非常相似。只是索引更新速度要好很多。

【问题讨论】:

  • 我玩了一点,看起来如果有任何流量正在访问索引(例如,从 .net sdk 查询或手动更新索引),索引器会变得非常慢。可能是在尽量减少对查询性能的影响?

标签: azure-cognitive-search


【解决方案1】:

查询流量是一个因素,但也可能是副本数。每个副本都为索引过程增加了工作,而每个分区都增加了可用于索引的并行度。如果您在新服务中添加了一个分区并进一步加快了索引编制速度,那将不会是令人惊讶的结果。

综上所述,在您的情况下,最可能的解释是您的新服务在faster hardware 上运行,而不是旧服务。这就是我们能够取消新服务的文档限制的方法。

【讨论】:

    猜你喜欢
    • 2023-03-03
    • 2017-12-15
    • 1970-01-01
    • 1970-01-01
    • 2018-04-09
    • 2020-03-02
    • 2021-07-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多