【问题标题】:azure search performance issue天蓝色搜索性能问题
【发布时间】:2015-02-25 16:21:35
【问题描述】:

我在天蓝色搜索中建立了一个索引。该索引包含几个字段,但我标记为可搜索的字段中只有 2 个。 该索引包含各种大小的完整单词 pdf 文件(当然是它们的文本),其目的是能够在文档搜索中使用。

索引很大 - 160k 个文档和 7.2 gb 大小。

当我查询到 2 个字母时,一切正常,但是当我遇到复杂的单词时,性能很差。

例如:短语 - elasti 耗时 59 秒。

在我的查询中 - 我使用过滤器,得分配置文件突出显示

经过一些调查 - 我可以看到突出显示功能导致了问题。

有什么想法吗?如何提高性能 - 可能会拆分为索引中的多个字段或类似的东西?

【问题讨论】:

    标签: azure azure-cognitive-search


    【解决方案1】:

    本周我们部署了一项改进,以提高荧光笔的性能。需要重新索引才能启用该功能。如果问题仍然存在,请随时通过 nateko@microsoft.com 直接与我联系。再次感谢您的宝贵时间。

    内特

    【讨论】:

    • 谢谢。我调查了一下——快速提问——你如何重新索引?重新上传文件?
    • 您必须创建一个新索引并上传文档。顺便说一句,您使用的是什么语言分析器?谢谢!
    • @NatoKo 抱歉回复晚了。我现在不使用任何语言分析器。我将重建索引,看看问题是否得到解决。谢谢
    【解决方案2】:

    您的猜测是正确的 - 搜索突出显示导致了这里的问题。启用突出显示后,Azure 搜索会在查询时间处理结果集中的每个项目/文本,以查找包含搜索命中的文本段。如果每个文本是 4.5mb (7.2gb/160k),这个过程可能需要很长时间。对于需要较长时间的复杂术语或短语,这是因为 Azure 搜索在找到足够数量的段后停止处理结果。我在 Azure 搜索团队工作。我将查看代码并确认。

    【讨论】:

    • 好的。那么我该如何解决呢?有没有办法限制短语的数量?我原以为如果搜索索引单词,他会指出它们在文档中的位置,以避免搜索整个文档。并且微软应该在文档中加入高亮选项有性能损失。我目前正在从事的整个项目都是基于亮点,我希望对此有某种解决方案。
    • 我们正在积极寻找提高搜索性能的方法,尤其是在突出显示方面。我们很快就会回到主题。
    • @NateKo 你们有 github 存储库或其他要提交的问题吗?我现在遇到很多 Azure 搜索问题,我想提交并跟进。
    • @Bart 请使用 Azure 论坛(下面的链接)提出问题或提出任何问题。谢谢! social.msdn.microsoft.com/forums/azure/en-US/…
    猜你喜欢
    • 2018-03-06
    • 2021-03-11
    • 2020-03-02
    • 1970-01-01
    • 2021-11-16
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多