【问题标题】:GKE randomly dropping connectionsGKE 随机丢弃连接
【发布时间】:2017-04-05 04:53:08
【问题描述】:

我们在 GKE 上运行一个 Kubernetes 集群,带有一个 NGINX 入口控制器(以便我们可以接受 WS 连接)和一个通过服务连接到它的网络负载均衡器,以便从互联网访问它。

大部分时间一切正常。但是我们会以看似随机的时间间隔出现“连接被拒绝”。

查看日志,似乎丢弃的请求从未命中 NGINX(NGINX 根本不会为这些请求记录任何内容)。我们尝试重新创建外部负载均衡器、服务等,但没有成功。不知道从哪里开始或问题出在哪里。

有人知道这个问题吗?或者有什么潜在的解决方案?非常感谢您的帮助!

【问题讨论】:

  • 嗨!你能分享更多细节吗?特别是关于您监控/体验此内容的方式以及网络详细信息。是不是只是监控->LB->节点池->Nginx Ingress?

标签: google-kubernetes-engine


【解决方案1】:

您是否尝试过创建新集群? GKE 世界中有时会发生奇怪的事情

【讨论】:

  • 唯一似乎有效的东西。很奇怪,但是新建集群后没有问题。
【解决方案2】:

您能否检查集群中的所有 kube-proxy pod 是否正常运行?使用以下命令:

kubectl get --namespace=kube-system pod -l component=kube-proxy  -o wide

可能某些 kube-proxy 无法正常运行。因此导致间歇性连接问题。

【讨论】:

  • 这是一个开始,它确实表明 pod 已重新启动,但没有日志。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 2020-09-02
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2016-05-07
  • 1970-01-01
相关资源
最近更新 更多