【发布时间】:2019-04-20 17:21:46
【问题描述】:
我很快将 2000 个短期作业发送到我的 kube 集群,我观察到在创建作业和作业的 pod 开始挂起之间存在几分钟的延迟。有人知道可能是什么瓶颈吗?
etcd 会是瓶颈吗?
【问题讨论】:
-
您是如何创造这些工作的?这 2000 个中的每一个都是独立创建的,或者它们是从单个作业中多次运行的批次的一部分?
-
您是否通过描述检查过您的 pod?也许您的节点资源不足
-
嗨,@DiegoMendes 这 2000 个工作是独立创建的。我写了一个脚本来创建 8 个线程的 2000 个作业。最初的几百个工作都很好,但是延迟越来越长。似乎有某种排队,但我不确定。我想知道是否有一些配置参数可以调整以缓解这个问题......
-
嗨,@cookiedough 我还没有检查我的 pod,但我很确定资源不是问题,因为与我的工作负载相比,我发送的集群有足够的 cpu 和 ram,但是我会仔细检查...
标签: kubernetes