【问题标题】:Elasticsearch reindex gets stuckElasticsearch 重新索引卡住了
【发布时间】:2021-02-27 01:16:02
【问题描述】:

上下文

我们有两个 Elasticsearch 集群,每个集群有 6 个和 3 个节点。 6个节点的集群是我们在生产环境中使用的集群,我们使用3个节点的集群进行测试。 (我们在两个集群中都有同样的问题)。所有节点都具有以下特点:

  • 弹性搜索 7.4.2
  • 1TB 硬盘
  • 8 GB 内存

在我们的例子中,我们需要重新索引一些索引。这些索引包含数十亿个文档,大小在 50GB 到 250GB 之间。

问题

每当我们开始重新索引时,无论是在内部还是从远程源,任务都会开始正常工作,但它会在没有明显原因的情况下停止重新索引。我们在日志中看不到任何内容。该任务没有被取消或任何东西,它只是停止重新索引文档,看起来任务卡住了。我们尝试改变 GC 策略,使用 CMS 和 Shenandoah,但没有任何改变。

有人遇到过同样的问题吗?

【问题讨论】:

  • 每个索引有多少个Docs?你有检查网络稳定性吗?在某些时候,您的平均负载 (cpu) 是否较高?
  • @OpsterElasticsearchNinja 我听从了你的建议。起初我们得到一个 SocketTimeoutException。我们解决了将 socket_timeou 值从 30 秒(默认值)更改为 10 分钟的问题,并在重新索引请求中添加了 "socket_timeout": "10m"。一旦我们改变了这一点,我们就会面临同样的问题。重新索引任务卡住了,我们在日志中看不到任何内容。我们和以前一样。该任务没有被取消或任何事情,它只是停止重新索引文档,看起来任务卡住了。
  • @taran 很长时间以来您都没有接受并支持我的答案,如果您的问题得到解决,如果您能接受并支持答案,那就太好了
  • @taran 很长时间以来您都没有接受并支持我的答案,如果您的问题得到解决,如果您能接受并支持答案,那就太好了

标签: elasticsearch elastic-stack


【解决方案1】:

如果不进行调试并且您提供的信息很少(缺少集群和索引配置、索引慢日志信息、elasticsearch 错误日志、Elasticsearch 热线程等等),很难找到这些问题的 RCA。

【讨论】:

    猜你喜欢
    • 2013-09-24
    • 2014-10-22
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2020-12-06
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多